Decideo: Noticias sobre Inteligencia de Negocios, Big Data, Data Science, Data Mining


Actualidades y análisis

IBM elige a Trifacta para desarrollar una solución de « Data Preparation »


, el 18 Agosto 2019 | Leído 425 veces

IBM dispone de una solución ETL («extraer, transformar y cargar») completa, DataStage, adquirida en 2005, pero no posee una solución de preparación de datos, algo que está más orientado a la ofimática. IBM eligió trabajar con Trifacta con el fin de desarrollar una integración entre las soluciones de los dos desarrolladores.



IBM elige a Trifacta para desarrollar una solución de « Data Preparation »
Después de haber trabajado varios meses en colaboración, IBM y Trifacta revelaron a finales de junio su alianza. Parece que IBM le confió a Trifacta el desarrollo de una herramienta de preparación de datos, conectada al ecosistema IBM. La « data preparation », de la que Trifacta reivindica la paternidad, es un nuevo mercado. Las « ETL » son herramientas técnicas, destinadas a equipos informáticos y a la industrialización de proyectos. Las herramientas de preparación de datos están más orientadas a los usuarios, más ágiles, pero también menos rigurosos. Tienen un lugar entre Excel y los sistemas ETL.

Como lo señala muy bien Trifacta, la diferencia entre dos proyectos de ciencia de datos no está realmente en los algoritmos. La mayoría de estos desarrollos están disponibles en open source y abiertos al público. La diferencia está más bien en los datos que alimentan a estos algoritmos. Y estos datos deben ser limpiados, preparados y referenciados.
Los usuarios avanzados se han acostumbrado a utilizar estas nuevas herramientas de preparación. ¡Pero no están libres de defectos! Más que suprimir los silos de datos, tienen tendencia a producir nuevos silos. Cada conjunto de datos (dataset), depurado y preparado, es guardado por su usuario, el cual crea de esta manera un nuevo silo, con mucha frecuencia no referenciado y no compartido...

Trifacta propone nombrar, etiquetar y compartir estos conjuntos de datos derivados. Y en el marco de su alianza con IBM, la idea es combinar estos nuevos conjuntos de datos con la herramienta de gobernanza IBM, Watson Data Catalog.

¿Cuál será el destino de esta alianza de aquí en adelante? Imposible de adivinar. Pero si IBM ve en ella una oportunidad de negocio interesante, no vacilará en adquirir a Trifacta con el fin de asegurar el dominio y el futuro de esta solución de preparación de datos.




Nuevo comentario:
Twitter

Usted puede comentar o proporcionar más información a todos los artículos de este sitio. Los comentarios son libres y abiertos a todos. Sin embargo, nos reservamos el derecho a eliminar, sin previo aviso ni explicación, todo comentario que no cumpla con nuestras normas internas de funcionamiento, es decir, cualquier comentario difamatorio o sin relación con el tema del artículo. Así mismo, los comentarios anónimos son eliminados sistemáticamente si son demasiado negativos o muy positivos. Exprese sus opiniones, compártalas con los demás y asúmalas. Gracias de antemano. Igualmente, agradecemos tener en cuenta que los comentarios no sean enviados automáticamente a los redactores de cada artículo. Si usted desea realizar una pregunta al autor de un artículo, contáctelo directamente, no utilice los comentarios.


Twitter
Rss
LinkedIn
Google+
Facebook