Inteligencia de negocios y big data para el mundo hispano parlante.

¡Subscríbase al boletín gratuito!


Inteligencia de Negocios en Español - Decideo.com





Actualidades y análisis

¿Cuál método usar mejor para la analítica de datos provenientes del IoT?


, el 16 Octubre 2017 | Leído 342 veces

De una u otra manera estamos conectados. Cada vez más, a través de "datos". Datos para la fidelización de los clientes, datos para predecir fallas de máquinas, datos para ser más eficientes en los estudios, datos para salvar vidas y finalmente, datos para hacer que el planeta tierra sea un sitio cada vez mejor para vivir. Los cerca de 50 billones de dispositivos que estarán conectados, de aquí al 2020, y que hacen parte del internet de las cosas -IoT- generarán brontobytes de datos, la medida que representará al universo digital del mañana. El gran reto: obtener el verdadero significado de toda esta explosión de información; ¿cómo? A través de la analítica de datos provenientes del internet de las cosas. Veamos cuáles son algunos de estos métodos analíticos (cuyos nombres dejaremos en inglés), las respuestas de negocio que ayudan a resolver y cómo usarlos.



STREAMING ANALYTICS

¿Cuál método usar mejor para la analítica de datos provenientes del IoT?
Hace referencia al procesamiento de extraer valor de grandes cantidades de información en movimiento que producen, por ejemplo, los sensores, capaces de emitir flujos de datos en tiempo real para medir una extensa gama de variables. Estas emisiones están basadas en eventos que ocurren como resultado de una acción o de un conjunto de acciones, que requieren de opciones tecnológicas para procesar esa secuencia de eventos, como, por ejemplo, el caso de fallas de alguna máquina en una "industria conectada".

Pero son muchas compañías, en diversos sectores, que se ven beneficiadas del streaming analytics de datos que provienen no solamente de sensores. Las empresas encuentran que los análisis en tiempo real de eventos críticos para sus negocios mejoran la capacidad de responder a clientes e influencien en sus decisiones de compras, analizando tweets, por ejemplo, para el caso de retails. Para el caso de manufactura, se evita el tiempo de inactividad no planificado mediante el monitoreo de las máquinas conectadas detectando a tiempo las fallas en los sistemas y optimizando la producción. Y por supuesto, en los automóviles conectados que desde hace ya varios años hacen parte de la industria orientada hacia los datos. Hoy hablamos de los autos sin conductor que como sea tienen que estar conectados para reaccionar en tiempo real para tomar decisiones en cuestión de nanosegundos. No cabe duda, que igualmente en ciberseguridad, cuando se trata de detener los ataques en internet a punto de ser cometidos por los malhechores cibernéticos.

El streaming analytics es usado para comprender "el comportamiento" de los datos en el momento que se producen. Tomemos el ejemplo de la "industria conectada", en donde cada vez más aparecen proyectos IoT. Estas fábricas cuentan con máquinas modernas totalmente conectadas y con miles de sensores, que le permiten colectar datos. Aquí encajaría perfectamente el análisis streaming de los eventos que se generan en forma continua. Esto le ayudará al encargado de operaciones, identificar patrones de comportamiento sobre los datos generados, tener alertas en tiempo real sobre fallas en componentes críticos, con el fin de tomar decisiones al instante reaccionando rápidamente, en cuestión de segundos, ya que conoce qué es lo que está sucediendo, y sabe en el momento preciso qué es lo que debe hacer y dónde actuar. Además, permite responder a interrogantes como:

- ¿Cuál es el mejor momento para realizar el mantenimiento de las máquinas?
- ¿Cuántos días se tendrá que dejar operar los equipos para que se le realice el mantenimiento?
- ¿Todas las piezas están en perfectas condiciones o algunas partes están por reemplazar?
- ¿Qué máquina no está operando en óptimas condiciones?
- ¿Cuál es la causa de las averías?
- ¿Cómo minimizar los tiempos de mantenimiento y paradas de operación innecesarias?

TIME SERIES ANALYTICS

Corresponde al método que explora el significado estadístico y que permite extraer información representativa de los datos que son colectados a intervalos de tiempos equidistantes o en determinados momentos de interés, que los estadísticos denominan, tiempo de series temporales.

Este método es usado para predecir eventos y comportamientos de la serie basados en datos ocurridos en el pasado en momentos igualmente espaciados; así se podrán identificar patrones en el futuro (extrapolación de tipo pronóstico). A diferencia del streaming analytics, estos datos de la serie se pueden analizar en cualquier momento para ayudar a entender el pasado, pero aún mejor, ayudar a predecir el futuro. Dos son los principales objetivos del análisis de series temporales. Uno es el identificar la naturaleza del fenómeno representado por la secuencia de observaciones y el otro es el pronóstico, predecir los valores de eventos futuros; por ejemplo, de las ventas, la economía, la producción mensual, el clima o datos demográficos, mediante la extrapolación del patrón de datos previamente identificado y establecido formalmente, con técnicas que permiten filtrar el ruido (error) que dificulta la identificación del patrón para hacer que éste sobresalga.

MACHINE LEARNING

Es usado para construir modelos. Este enfoque analítico incluye dos clases de tipos de aprendizaje para la construcción de estos modelos: el aprendizaje supervisado que comprende los algoritmos que encuentran patrones o estructuras ocultas en conjuntos de grandes volúmenes de datos usando una serie de métodos estadísticos avanzados para manejar tareas de regresión y clasificación. En las tareas de clasificación se identifica a qué clase pertenece un elemento, dado un conjunto de clases de entrenamiento, basado en los atributos de ese elemento y la comparación con los otros elementos en cada clase. Aquí los métodos estadísticos abarcan diferentes categorías de algoritmos, como por ejemplo SVM (Support Vector Machines), Discriminant Analysis, Naive Bayes, KNN (k- Nearest Neighbours) o algoritmo vecino más cercano. Entre las categorías de algoritmos para el caso de tareas de regresión, se pueden citar el modelo de regresión lineal MLG (Modelo Lineal Generalizado), SVR (Support Vector Regression), árboles de decisión, las redes neuronales, entre otros.

El aprendizaje supervisado aprovecha los algoritmos que optimizan las habilidades de toma de decisiones y razonamiento de los seres humanos mediante la lectura programática de reglas y preferencias ocultas.

El segundo tipo de aprendizaje es el aprendizaje no supervisado que encuentran patrones o estructuras ocultas utilizando otros métodos como el de Clustering que descubre patrones en los datos donde los elementos de cada clúster son más similares entre sí que cualquiera de los elementos en los otros clústeres. Los algoritmos más comunes dentro de este enfoque son K-means, método de agrupamiento jerárquico, método de los momentos, las redes neuronales, entre otros.

SPATIAL ANALYTICS

Este enfoque hace referencia al análisis de datos que tienen relevancia geográfica o espacial y es usado para predecir eventos según su ubicación. Este tipo de análisis ha surgido desde los inicios de la cartografía y tipografía.

Una de las primeras aplicaciones del análisis espacial fue aplicado en 1854 por el médico inglés John Snow, contribuyendo a los estudios de epidemiología sobre la cartografía para el entendimiento del brote de cólera más trágico ocurrido en la calle Broad (hoy llamada calle Broadwick) en Londres, Inglaterra.

Mapa de los casos de cólera de Londres en 1854.  Una de las primeras aplicaciones de análisis espacial basado en mapas
Mapa de los casos de cólera de Londres en 1854. Una de las primeras aplicaciones de análisis espacial basado en mapas
El Dr. Snow ubicó en el mapa del barrio, mediante cruces, las bombas de agua, e iba registrando las muertes que se producían por cólera, haciendo un punto. Esto arrojó un claro resultado de la representación visual de estas muertes: la gran mayoría de muertos se concentraban en torno a la bomba de agua de la calle Broad, siendo la principal fuente de propagación de la epidemia.

Hoy día, son diversos los métodos de análisis espaciales disponibles de acuerdo con la información y con el objetivo de búsqueda: análisis de distribución estadística, de densidad, de distancia, de proximidad, de autocorrelación o de interpolación.

Este análisis está basado en micro datos que poseen una geo referencia, ya sea relacionados con una posición, una dirección, un código postal, coordenadas geográficas, formas y tamaños de los elementos físicos. Esto puede ser útil, por ejemplo, en logística, para visualizar ubicaciones de, la flota de una empresa en un determinado momento y calcular las distancias entre ellas. Esta información de ubicación se puede complementar con la dimensión de tiempo, para analizar tiempos de ruta u otros indicadores relacionados con el espacio.

El análisis datos espaciales presenta para las empresas diversos desafíos pensando en qué infraestructura y gobernanza definir para aprovechar al máximo los datos espaciales. A la vez se convierte en un gran potencial debido a la combinación de la gran cantidad de datos espaciales y no espaciales. Los más comunes en los proyectos de IoT de este tipo, son los provenientes de sensores como los de posicionamiento, usados para ubicar o rastrear los objetos y procesar grandes cantidades de datos que yendo más allá, se pueden analizar usando otros métodos analíticos avanzados de los descritos anteriormente, como, por ejemplo, el de Machine Learning, con el fin de revelar patrones o decisiones de soporte (por ejemplo, optimización de rutas) o incluso predecir el comportamiento.




Nuevo comentario:
Facebook Twitter

Usted puede comentar o proporcionar más información a todos los artículos de este sitio. Los comentarios son libres y abiertos a todos. Sin embargo, nos reservamos el derecho a eliminar, sin previo aviso ni explicación, todo comentario que no cumpla con nuestras normas internas de funcionamiento, es decir, cualquier comentario difamatorio o sin relación con el tema del artículo. Así mismo, los comentarios anónimos son eliminados sistemáticamente si son demasiado negativos o muy positivos. Exprese sus opiniones, compártalas con los demás y asúmalas. Gracias de antemano. Igualmente, agradecemos tener en cuenta que los comentarios no sean enviados automáticamente a los redactores de cada artículo. Si usted desea realizar una pregunta al autor de un artículo, contáctelo directamente, no utilice los comentarios.


Twitter
Rss
LinkedIn
Google+
Facebook
Pinterest