Inteligencia de negocios y big data para el mundo hispano parlante.

¡Subscríbase al boletín gratuito!


Inteligencia de Negocios en Español - Decideo.com





Actualidades y análisis

Big Data en las finanzas: desde ya aplicaciones prácticas


, el 23 Agosto 2015 | Leído 835 veces

Si el objetivo de los proyectos Big Data es la creación de valor, el éxito está garantizado. Así lo demuestran los primeros logros en el campo de prevención de fraude, de los medios sociales y de los seguros. Pero el Big Data no es solamente una cuestión tecnológica, es también un tema en el que la creación de valor y la rentabilidad de la inversión están por encima de de la realización de los proyectos pequeños, iterativos y perfectamente canalizados.



Introducción

Philippe Nieuwbourg, experto en Data Science
Philippe Nieuwbourg, experto en Data Science
Si hablamos de una profesión íntimamente relacionada con los datos, nos referimos a un director financiero o a un encargado del control de gestión. La inteligencia de negocios se inventó en los años 70s para satisfacer las necesidades de gestión, desarrollo y control presupuestario. Los antepasados del Big Data se llamaban entonces Arbor, Comshare y Pilot Software, por lo que hablarle de datos a un agente financiero no es muy original.
Pero las tendencias recientes en los volúmenes y en especial las fuentes de datos abren nuevas perspectivas para el mundo de las finanzas. Algunas de las instituciones ya están formalizadas y documentadas en el tema, otras están en la etapa de la prospectiva. Estas últimas buscan la máxima creación de valor posible. A lo largo de este artículo, les propongo definir rápidamente el tema del Big Data y de su aplicación en el sector financiero y mostrar algunos ejemplos de proyectos actuales que detallan el valor que generan, y finalmente terminar con algunas observaciones sobre el papel de América Latina en este nuevo reto de analizar grandes volúmenes de datos.

Big Data ... o más bien datos voluminosos, complejos, rápidos y diversificados

La utilización global del término Big Data no solo les encanta a los anglófonos sino que es bastante sencillo de comprender. Sin embargo, en el mundo de habla hispana, utilizaríamos en su lugar “datos voluminosos”. La noción de volumen es en realidad un aspecto importante del tema. Aunque muchos expertos se burlan de esta definición, que en la actualidad cuenta con más de tres años, el Big Data se puede resumir en la famosa regla de las "3 V", volumen, velocidad, y variedad. Todo el mundo aspira hacerlo mejor que su competidor, y los más astutos del mercado le han añadido una "V" adicional para satisfacer su necesidad de singularidad. Pero las tres "V" Iniciales resumen perfectamente los acontecimientos recientes del mundo de los datos.

El volumen primero. Ya sea que hablemos de exabytes, petabytes o terabytes, no importa. Hoy la humanidad genera increíbles volúmenes de datos. No todos son interesantes, existen petabytes de videos de gatitos y cachorros en YouTube que no son todos útiles, pero existen, y al menos que su cliente sea un ermitaño, hay mucha probabilidad de que sus relaciones con los clientes genere diez o cien veces más datos que hace sólo unos pocos años atrás. Los volúmenes están creciendo rápidamente.

Luego la velocidad. Sólo tienes que consultar algunos medios de comunicación social para observar la velocidad con la que se generan los datos. Todo el mundo no es YouTube, Facebook o Twitter, por supuesto. Pero si usted es una gran empresa como Nike, Coca-Cola, Danone, SNCF, etc., el público habla frecuentemente de usted. Se sorprendería de leer la cantidad de mensajes por segundo que se emiten sobre usted en los medios sociales. Y si se analizan los datos recogidos por los sensores o sistemas de grabación, la tasa de generación es tal que el tratamiento por lotes (batch) es ahora insuficiente. Las ventanas de tiempo disponibles para estos tratamientos se reducen, no solo por el número de aplicaciones involucradas sino por la globalización de las empresas que trabajan en zonas horarias distintas. Esta velocidad es un componente importante del Big Data.

Finalmente la variedad. Anteriormente, los datos recogidos en la empresa eran todos o casi todos, numéricos o alfanuméricos, en el 2014 los formatos digitales han evolucionado notablemente. Encontramos datos estructurados, semi estructurados (archivos XML) o no estructurados (imágenes, vídeos, sonido, textos, etc.). Uno de los retos es aumentar el valor de estos datos estructurando a los pocos estructurados o no estructurados. Un ejemplo: La entrada al peaje automático de Londres. El sistema toma la foto de las matrículas, esto transforma los datos no estructurados en datos estructurados (lee la placa) y desencadena la facturación. La variedad es el tercer componente de Big Data.

A pesar de que hoy no vengo a venderles nada, me gustaría añadir a esta definición una "V", la V de la visualización. Debido a que trabajar estos datos voluminosos nos obliga a inventar nuevas técnicas para entender la representación gráfica de los mismos. Y ya que estamos a principios de año, añado como regalo otra "V", la V de valor, y este es probablemente el más importante, debido a que ningún proyecto de Big Data es de interés si no implica la creación de valor para la empresa que lo utiliza.

La fórmula ideal para representar el Big Data sería (Volumen + Velocidad + Variedad) X Visualización = Valor
Más adelante tocaremos este tema de nuevo, pero la dificultad mayor de los proyectos de "Big Data", tal como se abordan en las empresas actualmente, es a menudo, la poca o inclusive en algunos casos la ausencia de consideración de la noción de valor. Un proyecto Big Data nunca debe ser conducido exclusivamente por el departamento informático. Las necesidades del negocio son las que deben guiar la selección e implementación de una solución informática. Como el analista Shawn Rogers dijo, ¡un componente Hadoop no es una estrategia de Big Data en si misma! hay que pensar en el valor de su proyecto antes de hacer las compras de software.

Las finanzas a la vanguardia de los proyectos de Big Data

Hablando de valor, si hay un área en la que el valor se puede medir y donde es importante, es en la detección de fraude del sector financiero. Podríamos discutir de fraude de tarjetas de crédito o en los impuestos fiscales, o también del fraude organizado en el ámbito de los contratos públicos, todos estos desafíos económicos son muy significativos.

Frente a estos desafíos, los medios empleados pueden ser importantes y un proyecto, aunque caro, será fácilmente financiado si el retorno de la inversión está asegurado.

Las compañías de tarjetas de crédito y los bancos están a la vanguardia de la detección de fraudes, así como las agencias de calificación crediticia en Norteamérica. Sus problemas giran en torno al volumen, la velocidad y la variedad de datos. Son excelentes temas para proyectos de Big Data. El análisis predictivo está en el corazón de estos sistemas. El tiempo real también es un aspecto importante.

¿Cómo mejorar el algoritmo que decide validar o rechazar una operación?, ¿En base a qué información? ¿Cómo ser un poco mejor que el competidor o simplemente que el defraudador? Algunos recogerán nuevos datos, por ejemplo en las redes sociales. Si usted se acaba de conectar en FourSquare o en Facebook en la piscina de un hotel en Florida, puede ser un indicador adicional de que la transacción se produce en Turquía sea fraudulenta. Ninguno de estos indicadores será definitivo, pero una combinación de varios datos, estructurados y no estructurados puede permitir que el equipo cambie su puntuación y así mejorar la detección, sin aumentar el número de falsos positivos.

En el ámbito de las prestaciones sociales, algunos países han optado por utilizar las redes sociales para detectar comportamientos anormales. En Italia, por ejemplo, las fotos publicadas por los beneficiarios de determinadas prestaciones sociales, en los medios sociales son monitoreadas. Si usted recibe beneficios porque no puede trabajar, ¿Es normal pasar varias semanas en la playa? Por supuesto, el problema de la privacidad debe ser tenido en cuenta, pero los usuarios no siempre manejan los detalles de sus publicaciones y están más que dispuestos a compartir sus fotos con los que tal vez no deberían verlas.

Algunas compañías de seguros emplean los medios sociales en sus investigaciones. Tomemos el ejemplo de un robo que usted ha sido víctima. Todo el mundo sabe que el contrato de seguro no cubre si la propia víctima le hizo la vida más fácil al ladrón dejando las llaves bajo la alfombra. Pero enviar un mensaje público en Facebook que dice "¡Uf! Unas merecidas vacaciones, a partir de mañana durante 2 semanas en la playa" está cometiendo un grave descuido. Y si su hijo adolescente, poco conscientes de estos riesgos, publicó hermosas fotos de él (los famosos selfies) en el fondo con la gran TV de 50'' que decora su salón... su compañía de seguros tratará de exonerar a su remuneración mostrando que no ha actuado de cómo “buen padre".

Seguros: los que conducen mejor, pagan menos

En Canadá, dos compañías de seguros han innovado en el año 2013, ofreciendo un buen servicio para los conductores jóvenes. Los conductores jóvenes suelen ser penalizados por su inexperiencia. Pero no todos se portan mal. Estas empresas tuvieron la idea de apuntar al mercado de los jóvenes que manejan bien. Cómo identificar y sobre todo alentar a que se comporten correctamente. Simplemente introduciendo en el automóvil un dispositivo de recogida voluntaria del comportamiento del conductor. Una pequeña caja instalada por el asegurado, se conecta al automóvil y recoge una gran cantidad de datos: posición, velocidad, kilometraje, fecha y hora, también recolecta datos del frenado y de la aceleración repentina. Y el "conductor joven " ve su conducta modelada a partir de los datos recogidos de forma remota que son comparados con el estándar definido por la empresa. Si su comportamiento no se considera correcto, recibe una advertencia, entonces su bono especial puede ser retirado. Todo el sistema se basa en la recopilación de grandes volúmenes de datos de manera voluntaria.

Detección de piscinas no registradas ante las autoridades: un ejemplo de los datos no estructurados

Otro proyecto interesante Big Data, desde la perspectiva de TI, es el que permite detectar a los propietarios de piscinas que se han "olvidado " para hacer el registro en catastro y pagar el impuesto correspondiente. Podríamos estar en España, Portugal o cualquier otro país en el que el calor estimula a los propietarios de viviendas a construir una piscina. ¿Ha notado que casi todas las piscinas tiene un fondo azul? ¿Ha notado que en la naturaleza, el azul no es muy común? Si usted toma una foto aérea de un área, por ejemplo, alrededor de Valencia, se podrán identificar rápidamente a simple vista muchas piscinas presentes. Un análisis automatizado de las fotografías aéreas se puede hacer para identificar las piscinas, y la posición en el mapa. A continuación, se transforman los datos no estructurados (fotografías aéreas) en datos estructurados (la posición en un mapa). Este conjunto de datos se puede comparar con el registro informatizado de catastro. En pocos minutos se establece la lista de los propietarios de piscinas no registradas. Un pequeño consejo, si quieres escapar de este control automatizado, elija una piscina de forma original y evite el fondo azul. ¡Quizás podría engañar al programa!

Detección de fusiones y adquisiciones mediante el análisis de LinkedIn

Los estudiantes de la UQAM en Montreal lanzaron un proyecto de investigación que aplica el análisis de datos LinkedIn al mundo de las fusiones y adquisiciones. Ellos entendieron que antes de una operación de este tipo, incluso antes de que la transacción se anuncie públicamente, el contacto entre los empleados de las dos organizaciones se intensifica, especialmente a nivel superior. Analizar las nuevas relaciones y aplicar los algoritmos de data mining, permitiría detectar señales débiles, tal vez anunciando un posible acercamiento. Imposible, por supuesto, basarse en esta información solamente, pero cuando se combina con otros datos financieros, podría ser un activo importante en la espera de una operación.
Sin duda, una vez que la técnica es revelada, las empresas les indicaran a sus empleados las instrucciones específicas para detener cualquier contacto LinkedIn antes de una operación de este tipo. Sin embargo, el algoritmo podría entonces adaptarse, y la total falta de contacto se convertiría en un buen indicador.

Empiece poco a poco, pero sea rápido y ágil

El primer consejo para quien aspira explorar el tema del Big Data, es la creación de valor. Pero para identificar sus fuentes, es necesario experimentar. Por lo tanto es crucial no ver el Big Data como un proyecto estructurador, dependiente de manera exclusiva departamento de informática, en donde los primeros resultados se den a conocer luego de haber gastado varios millones de dólares. Es la agilidad la que debe guiar cualquier iniciativa en este ámbito.

Nadie puede garantizar que la idea de análisis de datos en realidad va a generar el valor que se espera. Pero a menudo, el concepto propuesto puede ser probado a pequeña escala y validarlo antes de ser globalizado. Es así como la línea aérea KLM eligió algunos vuelos para probar su servicio de selección de asientos en interfaz con las redes sociales. No había duda del riesgo que se tomaba al tocar el sistema global de reserva de vuelos, para poner a prueba la utilidad de esta nueva opción. La integración de la totalidad del proyecto piloto del sistema le costará al final un poco más caro, pero los riesgos de la fase inicial han sido en gran medida limitados. Manejar los riesgos del proyecto Big Data es una buena manera de entender que aun el análisis de datos no está bien dominado.

Este es un punto que explica el retraso en América Latina en esta área. Nuestro pensamiento holístico, que nos lleva a considerar todo antes de empezar a movernos, a veces retrasa la experimentación. Los países con métodos más ágiles tienen éxito en el lanzamiento de proyectos pilotos más rápido y hacen ajustes si es necesario. Pero las oportunidades son numerosas, por ejemplo en el ámbito de las ciudades inteligentes, donde América Latina es líder en el resto del mundo.

Comience con algo pequeño, experimente con rapidez, corregir, deshacer, rehacer, cambiar de dirección, todo esto es para aprender. Los proyectos de Big Data exitosos en cualquier parte del mundo, han seguido este camino.

Aunque cada etapa del proyecto debe ser financiada. Y volviendo al tema, si usted espera hasta obtener un presupuesto de varios millones de dólares para un proyecto cuyo TIR aun no está bien definido, probablemente sea adelantado por uno de sus competidores. Por lo que es importante limitar el presupuesto inicial. A menudo, la compañía ya cuenta con la mayor cantidad de herramientas necesarias. Es entonces sobre el método y experimentando que vamos a tratar de identificar la creación de valor. Una vez identificada, será mucho más fácil encontrar el presupuesto para el avance del proyecto y allí si demostrar el retorno de la inversión. Queda claro entonces que ¡Big Data no es un proyecto informático!




Nuevo comentario:
Facebook Twitter

Usted puede comentar o proporcionar más información a todos los artículos de este sitio. Los comentarios son libres y abiertos a todos. Sin embargo, nos reservamos el derecho a eliminar, sin previo aviso ni explicación, todo comentario que no cumpla con nuestras normas internas de funcionamiento, es decir, cualquier comentario difamatorio o sin relación con el tema del artículo. Así mismo, los comentarios anónimos son eliminados sistemáticamente si son demasiado negativos o muy positivos. Exprese sus opiniones, compártalas con los demás y asúmalas. Gracias de antemano. Igualmente, agradecemos tener en cuenta que los comentarios no sean enviados automáticamente a los redactores de cada artículo. Si usted desea realizar una pregunta al autor de un artículo, contáctelo directamente, no utilice los comentarios.


Twitter
Rss
LinkedIn
Google+
Facebook
Pinterest