Inteligencia de negocios y big data para el mundo hispano parlante.

¡Subscríbase al boletín gratuito!


Inteligencia de Negocios en Español - Decideo.com





Opiniones de expertos

Arquitectura de información: Límites y fronteras entre el ámbito transaccional y analítico


Carlos Chávez Broncano, el 4 Abril 2016 | Leído 903 veces

Una buena definición de Arquitectura de Información es el diseño del gran mapa de los requerimientos de información de una organización que abarca todos sus niveles (estratégico, táctico y operativo). Hoy en día, un desafío para los arquitectos de información es definir la forma de almacenamiento de los múltiples tipos de datos (estructurados, semiestructurados y no estructurados), enfocándose en el uso y el acceso.



Carlos Chávez Broncano
Carlos Chávez Broncano
El uso está relacionado a las diferentes necesidades de información de los consumidores (directivos, especialistas BI, usuarios del front-end y back-office), que tiene como eje principal el nivel de análisis que se requieren en las capas estratégica, táctica y operativa; en las dos últimas capas es donde se encuentra una zona “gris” que debemos delimitar, de no hacerlo, estaremos entrampados en discusiones largas para sustentar en que ámbito debe almacenarse. Asimismo, en los últimos años, el ecosistema de los datos ha sufrido un crecimiento exponencial que se genera por varios canales y con tipología diversa: social media, text, image, audio, video, web logs, sensors, etc. Por otro lado, las herramientas de software de Business Intelligence son usadas para acceder a los datos que residen en los entornos tradicionales (data warehouse, datamarts, base datos transaccional e intermedia) y proporcionar reportes, dashboards y minería de datos. Sin embargo, el creciente uso de los Sandbox, zona de laboratorio diseñado para los usuarios avanzados de Analytics, el cual se accede con herramientas básicas como SQL, en la práctica ha llevado a ser la competencia directa de los entornos tradicionales, volviéndose en almacenes de datos históricos, informales y poco gobernados que ocasiona no conocer quien accede a los datos y para qué. ¿Por dónde debemos empezar?
Desde mi punto de vista, debemos definir criterios que nos permitan diferenciar qué alojar en cada ámbito: Transaccional vs Analítico.

Entorno Transaccional

Comprende las bases de datos de las aplicaciones internas y externas de la organización. Asimismo, las bases de datos intermedias como MDM (Customer Hub, Product Hub), catálogos empresariales y para fines regulatorios o cumplimiento.
Enfoque en:
- Predomina la actualización de los datos.
- Proceso puntual.
- Datos en general desagregados y relacionados.
- Frescura de datos: dato reciente.
- Importancia del tiempo de respuesta de la transacción: instantáneo.
- Explotación de la información relacionada con la operativa de cada aplicación.
- Consumidor frecuente: usuarios front-end.

Entorno Analítico

Comprende las bases de datos analíticas de la organización clasificadas como: Landing Zone, Data Warehouse y Datamarts.
Enfoque en :
- Solo consulta.
- Proceso masivo.
- Datos en distintos niveles de detalle y agregación.
- Frescura de datos: dato histórico.
- Importancia del tiempo de respuesta masivo.
- Explotación de toda la información interna y externa relacionada a responder preguntas de negocio.
- Consumidor frecuente: usuarios back-office/power users.
Si bien los criterios presentados en los párrafos anteriores, son un primer paso para gestionar donde deberíamos almacenar los datos empresariales, aún está por resolver si es una utopía contar con un único repositorio central, completo e integrado; para luego distribuir desde dicho lugar la información según los distintos fines. ¿Es recomendable aún esta práctica? ¿Es el Data Warehouse el lugar ideal y tradicional para contener toda la información de la organización?
Un problema cotidiano que se presenta en el traslado de los datos, es que el flujo no solo ocurre en el sentido vertical, es decir, desde las bases de datos transaccionales hacia las bases de datos analíticas, sino también existe un flujo de datos en sentido horizontal que ocurre entre dos o más aplicaciones que requieren intercambiar datos para realizar transacciones. Otro aspecto diferencial, es que las fuentes de datos transaccionales requieren datos frescos (+ recientes) mientras que las fuentes de datos analíticas almacenan datos en el mejor de los casos con un desfase de horas.

La aparición de la plataforma hadoop con un costo bajo y gran capacidad de almacenamiento de los datos estructurados y no estructurados, nos permitirá alcanzar ese repositorio central, donde volcaremos los datos que el negocio necesita para su actividad, crecimiento y desarrollo competitivo, pero sacrificando el tema de la integración de los datos, el cual será realizado cuando encontremos valor a un nuevo modelo de análisis, que será promovido a los entornos tradicionales.

En conclusión, la línea divisoria entre los entornos transaccionales y analíticos, estará determinada por las necesidades de información de la organización, datos en su formato original o transformados, valores recientes o históricos y el entorno de cambio activo que nos exige a reducir el time to market de los proyectos de información. Por lo tanto, es un concepto clave a definir y sobre todo diferenciar del «data warehouse» que hasta hoy se mantiene como la estructura mejor adaptada al análisis repetitivo y comparativo de una organización.

Y usted, ¿qué piensa de esto? ¿Ha experimentado este dilema en la forma de almacenamiento de datos? ¿Qué criterios le parece que se puede adaptar o para cuáles no lo recomienda?

Sobre el autor: Carlos Chávez Broncano

Magister especializado en Inteligencia de Negocios. Experto en las principales herramientas Business Intelligence del mercado, así como experiencia comprobada en Data Discovery, visualización avanzada de datos, implementación de proyectos de Data Warehouse y mejora de procesos de la información en industrias de la banca y seguros. Igualmente es docente y expositor en temas de Arquitectura Empresarial y BPM.
https://pe.linkedin.com/in/carlos-chavez-broncano-03323319/fr




Nuevo comentario:
Facebook Twitter

Usted puede comentar o proporcionar más información a todos los artículos de este sitio. Los comentarios son libres y abiertos a todos. Sin embargo, nos reservamos el derecho a eliminar, sin previo aviso ni explicación, todo comentario que no cumpla con nuestras normas internas de funcionamiento, es decir, cualquier comentario difamatorio o sin relación con el tema del artículo. Así mismo, los comentarios anónimos son eliminados sistemáticamente si son demasiado negativos o muy positivos. Exprese sus opiniones, compártalas con los demás y asúmalas. Gracias de antemano. Igualmente, agradecemos tener en cuenta que los comentarios no sean enviados automáticamente a los redactores de cada artículo. Si usted desea realizar una pregunta al autor de un artículo, contáctelo directamente, no utilice los comentarios.


Twitter
Rss
LinkedIn
Google+
Facebook
Pinterest