Inteligencia de negocios y big data para el mundo hispano parlante.

¡Subscríbase al boletín gratuito!


Inteligencia de Negocios en Español - Decideo.com





Opiniones de expertos

Acompáñenos a presenciar el mantenimiento preventivo de un Boeing 787


Christophe Conche, Teradata, el 8 Octubre 2017 | Leído 454 veces

"Hola, y bienvenidos a bordo de este vuelo a Toulouse. Por favor, enderece la parte trasera de su asiento, pliegue su mesa y guarde todas sus pertenencias bajo el asiento frente a usted. Usted puede estar seguro, los 10.000 sensores de este Boeing 787 ayudarán a nuestro capitán y su tripulación a garantizarle un vuelo agradable y seguro ". Todavía no estamos en la fase de informar a los pasajeros, pero ya los sensores, las computadoras a bordo y los sistemas analíticos de tierra, llevan a los equipos de mantenimiento de aeronaves toda la información y análisis necesarios para optimizar sus operaciones, mejorar la seguridad de vuelo. En este período de vacaciones, puede volar a Europa o al Mundo. Vamos a averiguar cómo funciona. Los invito a tras bambalinas del análisis de datos aeronáuticos.



Photo by José Martín Ramírez C on Unsplash
Photo by José Martín Ramírez C on Unsplash
Mientras descansas tranquilamente a varios miles de metros de altitud, tu Boeing no deja de escuchar todos sus componentes. Más de 10.000 sensores monitorizan y miden continuamente lo que está sucediendo en la aeronave y su entorno externo: funcionamiento del motor, temperatura, presión, vibración, electricidad, turbulencia, altitud, humedad ... los parámetros a estudiar son numerosos. Y cuando ocurre un incidente, es la secuencia de acontecimientos y el estudio de todos estos parámetros que permiten comprenderlo y repararlo.

Pero los sensores no son la única fuente de información. Cuando el avión aterriza, mientras desembarca, y antes de que se abra el próximo vuelo, se descargan y analizan varios tipos de datos:
  
- El diario de registro de la tripulación en primer lugar, contiene información textual registrada por el capitán y su tripulación durante el vuelo. Este texto, que no está estructurado, se analiza automáticamente porque puede contener información valiosa sobre el progreso del vuelo

- Datos enviados en tiempo real durante el vuelo, cuando ocurrió un evento en uno de los motores; es generalmente una anomalía benigna, pasada enteramente inadvertida por los pasajeros, pero probablemente alerte a los equipos de mantenimiento para que se lleve a cabo una operación de verificación.

- Los datos de todos los sensores. Estos datos, que no eran de carácter de emergencia, se almacenan en la aeronave durante el vuelo y se descargan al aterrizar.
 
La famosa "caja negra", que desafortunadamente se menciona durante los accidentes, y que en realidad es naranja, es lo que se llama un "registrador de vuelo". Se utiliza para recopilar todos estos datos, y su contenido se descarga cada aterrizaje, antes de que se restablezca para el próximo vuelo.

El problema: poner en el orden correcto 15 GB de datos por vuelo

Christophe Conche, Director de Ventas Globales (Airbus, Safran, Thales y Dassault Aviation) en Teradata 
Christophe Conche, Director de Ventas Globales (Airbus, Safran, Thales y Dassault Aviation) en Teradata 
El data warehouse que recoge toda esta información, por lo tanto, se recupera de diversas fuentes, datos, estructurados y no estructurados, cuyo análisis comprenderá un evento y tomará decisiones. Los tripulantes de mantenimiento pueden ser confrontados con la siguiente situación: el piloto al mando anotó en el cuaderno de bitácora que oyó un ruido del motor izquierdo al comienzo del descenso durante quince segundos. ¿Qué hay que hacer? ¿Debe haber una operación de mantenimiento? ¿De dónde se originó este ruido y por qué parámetros fue causado? Y más directamente ... ¿puede el avión partir para su próximo vuelo, seguro para los pasajeros y la tripulación?

Para realizar este análisis, en unos minutos, debemos conectar el conjunto de datos, y recrear la secuencia de eventos. Y ya estamos hablando de Big Data. Cada vuelo de un Boeing 787 generará unos 15 GB de datos, en forma de una tabla de 60 millones de líneas. Y, por supuesto, hay que comparar los datos de un vuelo con los de otros vuelos, para posiblemente establecer correlaciones. Hay aproximadamente 340,000 vuelos de 787 por año. Por lo tanto, miles de millones de líneas y varios petabytes de datos tienen que ser analizados. 
 
Los sensores no envían sus datos exactamente al mismo tiempo. Sería imposible registrar miles de sensores al milésimo de segundo más cercano. Y muchos sensores envían una señal sólo cuando se cambia la información. Ninguna señal significa que el último valor sigue siendo válido. El primer trabajo consiste en alinear el conjunto de datos al milisegundo con el tiempo para responder a la pregunta: ¿Cuál era el estado de todos los sensores del vuelo en un momento preciso? Boeing había desarrollado inicialmente esto a través de una base de datos SQL tradicional. ¡Pero se tardaron 200 horas de consultas para analizar 100 horas de datos de vuelo! No se puede configurar un análisis en tiempo real ni calcular modelos de aprendizaje automático.

La solución: una base de datos temporal para identificar enlaces entre eventos

Para lograr esto, Boeing utilizó las funciones de análisis de tiempo en la base de datos Teradata 14.10. Este es un conjunto de funciones adicionales, que optimizan el manejo y la consulta de datos temporales. Desde un punto de vista técnico, los datos de los registradores de vuelo se descargan primero en un lago de datos, una estructura de archivos Hadoop de Hortonworks. A continuación, se normalizan; es decir que el conjunto de datos temporales vuelve a ser coherente y alineado. Luego, los datos, a través de Hive y Teradata QueryGrid (que permite consultar el lago de datos Hadoop en SQL), se inyectan en el almacén de datos de Teradata, donde se implementan las funciones de gestión de datos de tiempo. Los datos están entonces disponibles como una "tabla de hechos", y pueden ser solicitados.
 
Otro objetivo es reducir el volumen de datos transformando cada secuencia de instantes en un período de tiempo. Así que, cuando los datos no cambian, se hace innecesario mantener toda la información. Sólo se conservan puntos de datos cuando éstos cambian. En la base de datos, un "período" se convierte en un tipo de datos de tiempo, y es parte de estas nuevas funciones que mencioné anteriormente. Este trabajo permite resolver dos problemas: la alineación temporal de los datos; y la intersección temporal. Esta intersección temporal permite, a través de un comando SELECT convencional, conocer el estado del conjunto de sensores en un instante T, y así establecer correlaciones entre diferentes eventos. 

Ganancias obvias en el volumen de datos, y en la eficiencia de la consulta

Los números hablan por sí mismos. Los 15 GB de datos por vuelo descargados de la grabadora de vuelo se reducen a 190 MB una vez que se han procesado los datos temporales. La función de normalización de datos de tiempo puede reducir hasta 292 veces el número de líneas de datos. Y en términos de análisis, las ganancias son aún más impresionantes. Mencionamos anteriormente las 200 horas requeridas para ejecutar una solicitud en 100 horas de vuelos ... ¡Ahora son suficientes 17 minutos para analizar los datos de 1000 vuelos! Desde una perspectiva empresarial, esto significa que los científicos de datos pueden realizar más investigaciones, más comprobaciones cruzadas, probar varios modelos de posibles incidentes y, en última instancia, mejorar tanto la previsión de mantenimiento como la seguridad de los vuelos. Y en el futuro, los datos de audio e imagen se pueden recopilar y analizar de la misma manera, volver a una cadena de eventos basada en el tiempo. Podemos entonces preguntar de la misma manera si dos sonidos o dos imágenes son idénticas en el mismo período de tiempo. Los mismos principios de normalización y gestión del período se aplicarán aquí a los datos no estructurados.
 
Al abordar su próximo vuelo, tenga una idea de estos algoritmos que han funcionado en los últimos minutos, para garantizarle una salida segura o un retorno seguro. Es la cara oculta de este maravilloso mundo de la aviación. El trabajo de Clemente Ader y los hermanos Wright tiene más de cien años, pero es muy poco cuando vemos los progresos realizados. Hoy en día, en vuelo y sobre el terreno, las tecnologías de recolección y análisis de datos son esenciales para garantizar el buen funcionamiento de todos estos dispositivos y seguir persiguiendo este sueño de Ícaro, la mosca.

Sobre el autor: Christophe Conche tiene 19 años de experiencia con las principales compañías de software. Ahora es el jefe de la división de Aeronáutica y Defensa en Teradata. Christophe Conche, en su experiencia anterior, solía mostrar cómo las soluciones innovadoras podrían transformar el sector aeronáutico. Hoy en día, Christophe Conche también quiere convencer que una valorización de los datos podría servir al sector aeronáutico.




Nuevo comentario:
Facebook Twitter

Usted puede comentar o proporcionar más información a todos los artículos de este sitio. Los comentarios son libres y abiertos a todos. Sin embargo, nos reservamos el derecho a eliminar, sin previo aviso ni explicación, todo comentario que no cumpla con nuestras normas internas de funcionamiento, es decir, cualquier comentario difamatorio o sin relación con el tema del artículo. Así mismo, los comentarios anónimos son eliminados sistemáticamente si son demasiado negativos o muy positivos. Exprese sus opiniones, compártalas con los demás y asúmalas. Gracias de antemano. Igualmente, agradecemos tener en cuenta que los comentarios no sean enviados automáticamente a los redactores de cada artículo. Si usted desea realizar una pregunta al autor de un artículo, contáctelo directamente, no utilice los comentarios.


Twitter
Rss
LinkedIn
Google+
Facebook
Pinterest