Inteligencia de negocios y big data para el mundo hispano parlante.

¡Subscríbase al boletín gratuito!


Inteligencia de Negocios en Español - Decideo.com





Actualidades y análisis

MapR hace a Hadoop más eficiente y la acerca a las empresas


, el 11 Febrero 2014 | Leído 241 veces

Después de centrarse en el mercado de Estados Unidos, MapR se interesa en Europa. La empresa le encargó el desarrollo del mercado del Sur de Europa (Francia, España e Italia) a Xavier Guérin. A pesar del retraso de estos países de entre 18 y 24 meses con respecto a los Estados Unidos, hay mucho interés por esta tecnología, la cual permite mejorar el rendimiento de Hadoop, y la integración del sistema de información empresarial.



Xavier Guerin, vicepresidente del sur de Europa y Benelux MapR
Xavier Guerin, vicepresidente del sur de Europa y Benelux MapR
Hadoop fue creado por Yahoo. Inmediatamente, Yahoo entregó el código fuente a la comunidad Apache, que es la responsable de su puesta a disposición para todos.
MapR fue creado con el objetivo de responder a los problemas mediante la implementación de soluciones de Hadoop en términos de rendimiento, estabilidad, escalabilidad y robustez.
Hadoop puede manejar en paralelo masivamente cualquier tipo de consultas. Sin embargo, el reto ahora es hacer que sea utilizable por todas las empresas, y no sólo por aquellos capaces de reclutar hiper-especialistas en la materia.

Después de dos años de desarrollo, MapR ha lanzado su propia gestión de archivos del sistema, MapR FS. El nombre de la empresa hace alusión a MapReduce, pero no hay ninguna relación jurídica o de propiedad intelectual entre los dos.
Hadoop ya de por sí es un sistema de archivos, el famoso HDFS (Hadoop File System), pero es un sistema de archivos de tipo objeto, desarrollado inicialmente en Java. No obstante, MapR ofrece un tipo de sistema de archivos NFS, desarrollado en C.
"El tipo objeto es muy restrictivo. Funciona un poco como HTTP, con llamadas de los objetos. No se puede leer directamente un archivo, hay que recuperarlo, leerlo, posiblemente cambiarlo y luego devolverlo a su almacenamiento", dijo Xavier Guerin, vicepresidente del sur de Europa y Benelux MapR

Hadoop replica cada archivo tres veces, MapR respeta esta operación. Por otra parte, los archivos se dividen en segmentos y se almacenan en varias máquinas, de donde viene la eficiencia en el acceso a los datos y por lo tanto la fuerza de Hadoop.
El objetivo de MapR es proporcionar la tecnología Hadoop al mayor número de empresas y permitir el uso de las aplicaciones críticas en este entorno.
"Esta es una estrategia muy diferente a otras distribuciones de Hadoop que existen en el mercado", dijo Xavier Guerin. "Los otros están posicionados en el apoyo, asesoramiento, orientación, o en interfaces gráficas más agradables de usar que los comandos Hadoop". MapR ha desarrollado su propia tecnología, sin dejar de ser 100% compatible con la API de Hadoop.
"Facilitamos a la comunidad todo el código que desarrollamos en torno a diferentes lenguajes de programación. Nos comprometemos a mantener compatibles 100% nuestros APIs. Pero nuestro valor añadido es el sistema de archivos MapR FS que permite el acceso a los datos a través de NFS, lo que hace la vida más fácil a las empresas", dijo Xavier Guerin.

De momento, el objetivo no es reemplazar las bases de datos SQL tradicionales, pero en su lugar, lograr el mismo nivel de servicios requeridos por las empresas que utilizan soluciones de Oracle o Teradata.
MapR ofrece funciones para empresas como
- Una "fotografía" (snapshot) lo que permite, por ejemplo, iniciar un proceso de comparar dos conjuntos de datos;
- Una "recuperación de desastres" (“disaster recovery”);
- Una función de creación de reflejo de la base en dos grupos para asegurar la infraestructura;
- Los algoritmos de compresión.

"El espacio de almacenamiento es un gran problema en el entorno Hadoop ya que el espacio en bruto debe ser multiplicado por tres -cada archivo se replica tres veces. Se necesita una gran cantidad de espacio en los centros de datos para albergar una infraestructura Hadoop. MapR incorpora la compresión en el sistema de archivos, lo que reduce el número de máquinas necesarias para una sola base de datos", dijo Xavier Guerin.

El futuro está en la aplicación interactiva

Hadoop es visto por muchos como una herramienta para el proceso por lotes, en lugar de ser empleada para las aplicaciones interactivas. "Este es el caso hoy en día, pero esto va a cambiar con la llegada de herramientas como Impala, impulsada por Cloudera, que permite crear SQL interactivo en un sistema de archivos Hadoop", dijo Xavier Guérin.

"Podemos imaginar la integración de aplicaciones en Hadoop. Igualmente, podemos almacenar y procesar en MapR, que no es el caso de los clientes que utilizan Hadoop en general. Los datos se colocan en Hadoop se calculan y se recuperan. Es decir, Hadoop no se utiliza para el almacenamiento de datos de la aplicación”.
Actualmente MapR trabaja con un cliente que tiene un petabyte de datos almacenados en la base de datos de Microsoft SQL Server. La gestión de entradas y salidas es un problema. El cliente debe transferir su almacén principal de datos hacia un sistema Hadoop, a continuación, devolver los resultados de los cálculos a las bases de datos SQL directamente interrogados por las herramientas de recuperación. Los cubos de datos se crean por un Hadoop en lugar de una actividad de SQL Server.

Eventualmente, se podría encargar a Hadoop algunas aplicaciones transaccionales, de alta disponibilidad. "Esto no es para el 2014, pero podría ser un objetivo. MapR ya proporciona importantes mejoras de rendimiento, permitiendo más interactividad", dijo Xavier Guérin.

El sur de Europa en el juego

Según Xavier Guérin, los Estados Unidos tiene entre 18 a 24 meses de adelanto. Sin embargo, él percibe en el sur de Europa, un interés de parte de los grandes grupos, principalmente las compañías de seguros, bancos, operadores de telecomunicaciones, los grandes sitios web y el área de distribución. Por último, de parte de los clientes tradicionales de las herramientas de BI, que continúan experimentando con nuevas tecnologías para mejorar su infraestructura.

En el sur de Europa, señala Xavier Guérin, el sector financiero es muy sensible a los avances en el campo de la detección de fraudes. Pero en algunos países como España e Italia, los argumentos económicos prevalecen cuando aun se pueden hacer tratamientos con una infraestructura existente, este es un asunto delicado en las empresas. Los clientes tradicionales de Oracle Exadata o Teradata pueden extender su uso a través de la tecnología MapR sin invertir más en sus almacenes de datos existentes. MapR trata de convencer que busca complementar las inversiones existentes y no reemplazarlas.

En el sur de Europa, el análisis de la experiencia del cliente se refiere al mundo de la distribución, en particular el análisis de los vínculos entre el sitio web de la empresa y el tráfico en la tienda real. Un primer cliente está trabajando en la producción de esta tecnología en Francia desde casi un año, pero se niega a revelarla el exterior.
Para Xavier Guérin, el sur de Europa está ahora en condiciones de participar en el crecimiento de la compañía a nivel mundial. Y las perspectivas futuras para el tiempo real e interactivo parecen sonreírles a los líderes MapR.




Nuevo comentario:
Facebook Twitter

Usted puede comentar o proporcionar más información a todos los artículos de este sitio. Los comentarios son libres y abiertos a todos. Sin embargo, nos reservamos el derecho a eliminar, sin previo aviso ni explicación, todo comentario que no cumpla con nuestras normas internas de funcionamiento, es decir, cualquier comentario difamatorio o sin relación con el tema del artículo. Así mismo, los comentarios anónimos son eliminados sistemáticamente si son demasiado negativos o muy positivos. Exprese sus opiniones, compártalas con los demás y asúmalas. Gracias de antemano. Igualmente, agradecemos tener en cuenta que los comentarios no sean enviados automáticamente a los redactores de cada artículo. Si usted desea realizar una pregunta al autor de un artículo, contáctelo directamente, no utilice los comentarios.


Twitter
Rss
LinkedIn
Google+
Facebook
Pinterest