Inteligencia de negocios y big data para el mundo hispano parlante.

¡Subscríbase al boletín gratuito!


Inteligencia de Negocios en Español - Decideo.com





Opiniones de expertos

Plataformas analíticas avanzadas: criterios de evaluación presentes y futuros


Diego Arenas Contreras, el 12 Julio 2016 | Leído 724 veces

Las plataformas analíticas avanzadas han alcanzado un desarrollo importante y seguirán en esta tendencia. La preocupación por la interfaz de usuario, el procesamiento de datos en streaming, la necesidad de crear estándares para la industria, y el uso de integración de datos son algunas de las características a tener en cuenta. Se observan sinergias en la integración de herramientas ETL y plataformas analíticas, además de la preocupación por el medio ambiente en el consumo de energía en el procesamiento de grandes volúmenes de datos.



Diego Arenas Contreras. Consultor Freelance en Business Intelligence y Data Mining
Diego Arenas Contreras. Consultor Freelance en Business Intelligence y Data Mining
Las plataformas de análisis predictivo están siendo cada vez más comunes al interior de las empresas. La capacidad de predecir el comportamiento de los consumidores era una característica que pocas empresas, en el pasado, podían lograr. La preocupación de los vendedores por construir plataformas con interfaces de usuario amigables y hacer el servicio de Inteligencia de Negocios y Data Mining accesible a más colaboradores dentro de la organización ha impulsado una mayor demanda de soluciones analíticas.

En el cuadrante mágico de Gartner 2016 sobre Plataformas Analíticas Avanzadas, en donde se analizan 16 plataformas analíticas avanzadas, uno de los requisitos para considerar una plataforma en el cuadrante es que tenga una interfaz de usuario “drag and drop”, que permita a los usuarios arrastrar los operadores que requiere y construir así un flujo de trabajo con los elementos que necesita. Este tipo de interfaz hace más simple el uso de algoritmos complejos. Solo es necesario conocer el flujo del proceso para realizar modelos predictivos. Sin este tipo de interfaz gráfica, se hace necesario conocer además parámetros y elementos de configuración de los algoritmos utilizados.

Otro requisito para entrar en el cuadrante, es que la plataforma haya generado al menos 4 millones de dólares en licencias o servicios asociados en los últimos 12 meses. Esto deja afuera del análisis a bibliotecas de machine learning para lenguajes como Python, R y Scala, los cuales pueden ser usados en las organizaciones sin generar ganancias para una empresa en particular.

Un tercer criterio de selección es que la plataforma permita visualizar los datos y generar reportes. En mi opinión esto no debiera ser una restricción, sino más bien algo a destacar, lo importante es la integración que pueda lograr con otras herramientas o plataformas especializadas en visualización de datos. Recordemos que son plataformas “avanzadas”, no son de carácter exploratorio en donde la visualización y simplicidad de uso son importantes; en este caso la correcta interpretación de los resultados es lo importante debido a la gestión que el negocio hará basado en éstos.

A las plataformas predictivas se suma el uso de análisis prescriptivo, el cual permite sistematizar el flujo de información y acciones basado en los resultados de los modelos predictivos. Con la capacidad de calcular los beneficios futuros basados en los resultados de las gestiones sobre los resultados. Muchas veces ocurre que los resultados de modelos predictivos no se gestionan a tiempo o simplemente no se gestionan; la implementación de un sistema prescriptivo soluciona este problema y genera optimizaciones que resultan beneficiosas para las organizaciones. Las empresas debieran pensar en este tipo de soluciones al momento de licitar modelos predictivos, y tener un delivery acorde a los resultados.

La capacidad de procesar streaming data es una tendencia requerida para evaluar una plataforma analítica. Los modelos descriptivos y predictivos para datos estáticos vienen incorporados y son mainstream; poder conectarse a un flujo de datos como de redes sociales, indicadores de rendimiento en línea, sensores que envían un flujo constante de datos y poder extraer información relevante y predecir comportamiento en tiempos cercanos a tiempo-real es un desafío para las plataformas analíticas. Por esto Internet Of Things (IoT) y el procesamiento de Streaming Data serán importantes en la evaluación de herramientas analíticas avanzadas en el futuro.

Otro elemento importante es la integración con plataformas para procesamiento de Big Data, permitir la incorporación de datos desde IoT y procesar en Hadoop.

Para lograr esto se hace necesario además un marco de trabajo común, estándares para publicar casos de éxito en industria, para intercambiar modelos entre plataformas, para permitir la escalabilidad en otras tecnologías, etc. Se requiere llevar el desarrollo al siguiente nivel. Es la industria y necesariamente la academia la principal interesada en participar de la elaboración de estándares que rijan al resto de las plataformas. Cualquiera de las 16 plataformas en el cuadrante o las miles que no están en él pueden colaborar en este esfuerzo. Por ejemplo, PMML (Predictive Mdel Markup Language) es un estándar en el cual participan varias compañías del mundo del análisis predictivo. Para realizar cambios al estándar todas las compañías que apoyan PMML deben estar de acuerdo, lo que significa un 100% de acuerdo. Esto conlleva a tener una nueva versión cada 2 años aproximadamente.

Se ve una sinergia en el desarrollo de herramientas ETL y plataformas analíticas. El uso de workflows como visualización histórica de las herramientas de ETL puede ser útil a la creación de modelos descriptivos, predictivos y prescriptivos. La gran variedad de conexiones e integración con otros sistemas, motores de bases de datos, plataformas, etc. es natural en las herramientas ETL y de especial interés para las plataformas analíticas avanzadas ya que permite extraer los datos desde sus orígenes, transformarlos en el proceso y finalmente enviarlos a donde sean requeridos de acuerdo a los modelos prescriptivos en el formato necesario. Por otra parte, los algoritmos de machine learning utilizados en plataformas analíticas avanzadas son altamente encapsulables, es decir, pueden funcionar como módulos independientes con las adecuadas entradas y salidas al modelo, lo cual permite integrar estos algoritmos en las plataformas de ETL como un operador más con sus parámetros disponibles para ajuste.

Una preocupación hoy en día es el consumo de energía. El procesamiento masivo de datos para tareas analíticas demanda alto rendimiento en operaciones de la infraestructura tecnológica. El alto uso de procesamiento implica alto consumo de energía en data centers por parte de los servidores. Si bien existen iniciativas de hacer el procesamiento de datos más amigable con el medio ambiente.

En conclusión, la evaluación actual de plataformas analíticas avanzadas no se parece a cómo se evaluaban en el pasado y sin duda, no será similar a la evaluación en los próximos años en donde: factores como el procesamiento de grandes volúmenes de datos, algoritmos para procesamiento de streaming data, y datos desde IoT serán requeridos; la interfaz de usuario y visualización de datos pasarán a segundo plano, dando más espacio al delivery prescriptivo de las gestiones; se observa además un potencial de integración entre herramientas ETL y plataformas de análisis; finalmente, el consumo de energía es importante para el medio ambiente, por lo tanto el uso de algoritmos y hardware eficientes en consumo energético será un criterio para el uso de una tecnología por sobre otra.




Nuevo comentario:
Facebook Twitter

Usted puede comentar o proporcionar más información a todos los artículos de este sitio. Los comentarios son libres y abiertos a todos. Sin embargo, nos reservamos el derecho a eliminar, sin previo aviso ni explicación, todo comentario que no cumpla con nuestras normas internas de funcionamiento, es decir, cualquier comentario difamatorio o sin relación con el tema del artículo. Así mismo, los comentarios anónimos son eliminados sistemáticamente si son demasiado negativos o muy positivos. Exprese sus opiniones, compártalas con los demás y asúmalas. Gracias de antemano. Igualmente, agradecemos tener en cuenta que los comentarios no sean enviados automáticamente a los redactores de cada artículo. Si usted desea realizar una pregunta al autor de un artículo, contáctelo directamente, no utilice los comentarios.


Twitter
Rss
LinkedIn
Google+
Facebook
Pinterest