Inteligencia de negocios y big data para el mundo hispano parlante.

¡Subscríbase al boletín gratuito!


Inteligencia de Negocios en Español - Decideo.com





Entrevistas

"Se ha cometido un error muy grande en pensar que todo se reduce a la técnica"


, el 5 Marzo 2017 | Leído 1398 veces

Entrevista con Alberto González Paje, Data Scientist del que es considerado como el primer estudio de visualización de datos interactiva que se fundó en Europa.



Alberto González Paje, Data Scientist
Alberto González Paje, Data Scientist
Más de 16 años trabajando como analista de datos, diseñando y construyendo sistemas de información que han permitido, que altos ejecutivos, tomen decisiones basadas en evidencias cuantitativas de una manera más fácil. Con el perfil mixto del científico de datos: economista, sabe de programación y traduce las necesidades de negocio de los clientes para la construcción de productos y servicios basados en datos.

Sus ganas de trabajar en visualización de datos lo llevaron a descubrir, vía YouTube, al profesor Ben Shneiderman, quien durante muchos años ha dirigido el Human- Computer Interaction Lab de la Universidad de Maryland y quien es más conocido como el creador del tipo de gráfico Treemap. Esto le abrió bastante la mente, en cuanto a visualización de datos. Hace 5 años regresó de trabajar de Holanda, país donde también realizó parte de sus estudios profesionales, además de formarse en España, y a partir del 2011 empieza a trabajar en Bestiario.

En entrevista con Decideo, Alberto González Paje, nos cuenta cómo el primer estudio de visualización de datos interactiva que se fundó en Europa, pasa de tener un enfoque más artístico a un enfoque utilitarista. Además, nos habla sobre Quadrigam, la herramienta de visualización de datos, creada por Bestiario para que la gente, que no ha tenido la suerte, pueda acceder a técnicas de interacción basadas en el Data Storytelling, con o sin Big Data. Adicionalmente, indica cuál es la gran dificultad que tienen los llamados Data Scientists para que estos mismos puedan construir productos basados en datos.

A continuación, la entrevista editada con Alberto González Paje para Decideo en español.

¿Cómo define a la compañía? ¿Qué es Bestiario?

Bestiario es una empresa, con doce años en el mercado, sobre todo, de diseño de productos y servicios basados en datos. Está considerado como el primer estudio de visualización de datos interactiva que se fundó en Europa en el año 2005, cuando la visualización de datos interactiva no tenía una eclosión. En esa época, se juntan 3 personas: un matemático, un arquitecto - ambos colombianos - y un empresario español, y se les ocurre la idea de crear un estudio para hacer visualización de datos interactiva.
Como era algo muy novedoso, durante los primeros años fue difícil llegar a los sitios o poder vender un producto o proyecto, porque no había una referencia, ni había una competencia, ni se entendía exactamente lo que podía ser la visualización de datos. Entonces, en los primeros años se hicieron proyectos mucho más experimentales y muchos más relacionados con el plano artístico. En la época en la que estamos ahora, hemos cambiado de un enfoque más artístico a un enfoque utilitarista. Nos gusta diseñar productos y servicios que vayan a servir a cuanta más gente mejor.

¿Qué perfiles poseen las personas que trabajan en Bestiario?

Los perfiles que trabajan en la empresa son: ingenieros, matemáticos y diseñadores. En el 2005, empieza con los 3 fundadores; ahora mismo somos 17 personas en dos oficinas, la principal está en Barcelona, donde estamos el 90% de la gente, y tenemos una pequeña oficina en Bogotá - tenemos raíces colombianas-.
La gran mayoría de la gente que trabaja se dedica a lo que es desarrollo y son ingenieros informáticos o físicos matemáticos. Otro 40% de la estructura son personas especializadas en diseño. Dos o tres personas, con el perfil business, somos los que llevamos la coordinación de los proyectos, la relación con los clientes, una serie de tareas que están en el universo que no es ni el desarrollo ni el diseño puro.

¿Cuáles son sus principales responsabilidades como Data Scientist en Bestiario?

Me encargo de intentar traducir las necesidades de negocio de nuestros clientes para la construcción de productos y servicios basados en datos. Tengo una facilidad para hablar con la gente técnica, pero sobre todo, mi papel está mucho más enfocado a Project Management y a todo lo que es Data Science, tanto a nivel interno para nuestros temas, o cuando algún cliente nos pide crear, por ejemplo, un modelo de predicción.

¿Cuál es el posicionamiento de la compañía?

El posicionamiento nos lo va construyendo nuestros clientes a través de los pedidos que nos hacen.
Es verdad que los últimos años, por determinadas razones, que no han sido estratégicas sino de mercado, nos hemos especializado más en trabajar con instituciones financieras, con bancos, como el Sabadell y La Caixa; pero nos gusta trabajar con clientes muy diferentes. Llevamos dos años trabajando con Dom Pérignon, la conocida marca de champagne francesa, en proyectos de varios años donde trabajamos mucho en intentar traducir su cultura a una Data Driven Culture y sacar el mayor partido de los datos.
También por cuestión geográfica y porque también nos gusta mucho, hemos tenido la oportunidad de trabajar con un cocinero español muy famoso y hemos estado durante dos años intentando traducir su método de pensar y su método de trabajar, tanto a nivel de creatividad como a nivel de innovación, a intentar estandarizarlo para que ese método pueda servir en cualquier otro sector.
En Latinoamérica, hemos trabajado bastante con la Corporación Andina de Fomento, un banco de desarrollo latinoamericano, con la sede central en Caracas, pero es un banco que está financiado por bancos de todo Latinoamérica. El año pasado hicimos un proyecto para el medio colombiano La Silla vacía, y también hemos hecho un proyecto para la aplicación web Finalap de carreras atléticas en Colombia.
También hemos trabajado con el National Geographic. Vamos un poco donde nos lleva el mercado. Nos gusta trabajar con empresas del sector financiero pero también nos gusta trabajar con temas relacionados con arte; por ejemplo, hemos hecho ahora el diseño de una exposición que hay en el Centro de Arte Contemporáneo en Barcelona. Nos hemos encargado de hacer todo el diseño y la arquitectura.
Es importante decir, que en el grupo de trabajo que tenemos, hay 2 arquitectos. También hacemos exposiciones e instalaciones relacionadas con datos, con lo cual, somos una agencia un poco diferente a lo standard, porque hacemos desde temas más estratégicos a temas más de arquitectura, todo relacionado con datos, porque al final es la materia prima con la que trabajamos, pero no es fácil encontrar un grupo de trabajo con esas características.

¿Qué es Quadrigam?

Quadrigam es un software de visualización de datos que creamos nosotros mismos para ponerlo a disposición de la gente con el conocimiento que hemos ido adquiriendo durante estos años, para quienes no han tenido esa suerte, puedan acceder a técnicas de interacción y temas de Data Storytelling.
Es una herramienta en web, de tal forma que desde cualquier ordenador con conexión a internet puede conectarse y utilizarse. Fundamentalmente es un editor web que permite construir historias basadas en datos; generalmente se tiene una colección de gráficos y otro tipo de elementos, como textos, imágenes, videos, y con un sistema drag and drop y sin tener que programar, se puede crear un proyecto donde se vayan mezclando gráficos, imágenes con videos y textos.
Una vez que se ha creado ese proyecto, lo puedes publicar a través de una página web y digamos que, cualquier tipo de análisis que se hace corporativo, como las visualizaciones que se hacen en un periódico o cualquier otro lado, pueden ser construidas por el usuario. Todos los datos que utilizas para construir tus historias en Quadrigam, se almacenan en tu cuenta de Google Drive; nosotros no tenemos acceso a esos datos y puedes seguir manteniendo una privacidad. Una vez que has terminado de construir el proyecto, tienes 3 opciones: por un lado, te puedes bajar el código HTML5 que has ido generando, por si lo quieres alojar en un servidor propio; te puedes bajar el típico código que generan muchas herramientas para que lo puedes cargar en tu página o blog; para aquella gente que no quiera tener su publicación en ningún otro sitio, nosotros en un servidor nuestro, alojamos la publicación con la url generada. Damos la opción desde, la gente que no tiene ningún conocimiento de programación, a la gente que quiere hacer pruebas de conceptos en Quadrigam, y llevarlo a un servidor.

¿Qué herramientas se consideran competencia de Quadrigam?

Es difícil, pero probablemente la más conocida y de la que todo el mundo se siente reflejado es Tableau.

Una de las ventajas que tiene Quadrigam, es que tiene una cuenta gratuita donde se pueden utilizar todas las funcionalidades de la herramienta y puedes publicar hasta una docena de proyectos; básicamente limitamos el número de publicaciones porque ahí es donde nosotros tenemos un coste. Luego tienes la opción, si quieres, de una cuenta Pro que son 20 Euros al mes y tienes hasta 120 proyectos que puedas publicar.

Respecto a Tableau, es difícil decir que hagamos algo superior, porque date cuenta que Quadrigam es un proyecto part-time con un grupo de 17 personas. Normalmente nosotros solemos tener entre cuatro y cinco proyectos de consultoría al mismo tiempo. Tableau lleva desde el año 2003 y son muchas más personas con mucho más dinero.

Lo que más nos diferencia es la capacidad o facilidad para construir el que hoy se llama Data Storytelling. Como empresa, creo somos hasta cierto punto innovadores, yo tengo la impresión de que todavía es un poco pronto y la gente no está del todo acostumbrada a hacer este tipo de historias. Nosotros hemos tenido contacto con mucha gente del mundo del periodismo y ellos que son especialistas en ello, a veces les cuesta también ver el potencial que tiene el contar las historias de una manera más gráfica.

Con Quadrigam, yo creo que es más fácil construir una historia que te quede más bonita sin ser diseñador. Con Quadrigam es más fácil construir resultados más diferentes. Si tengo una publicación con Tableau tengo la impresión que estoy viendo lo mismo. Con lo nuestro, si entras en Gallery, cuando abras varios proyectos parece que no estén hechos con la misma herramienta. Entonces yo creo que, en ese sentido, es más creativo, es más fácil de tener algo que sea más bonito; evidentemente hay muchas cosas que hacemos inferior que Tableau.

Tenemos un equipo de ingeniería que cuando surge cualquier incidencia, la trabajan y la solucionan, es un poco el planteamiento. Ahora mismo tenemos 10 mil usuarios repartidos por todo el mundo; no nos suelen reportar muchos fallos; cuando tenemos algún fallo, lo miramos, lo corregimos y sacamos una nueva versión con el fallo corregido.

¿Cómo los han acogido en el ecosistema en España? ¿Hay un mercado suficientemente maduro?

En España ha habido bastante tradición de infografía. En ese sentido hay una cierta fuerza y una cierta cultura en lo que es la parte de infographics, en toda la parte de los medios de comunicación. Hay además infografistas españoles que ahora están repartidos por todo el mundo y todos los años hacen un evento. En el mundo de la infografía hay un cierto desarrollo.

En el mundo de la visualización de datos hay un cierto desarrollo porque hay algunas empresas españolas que están haciendo cosas interesantes, como por ejemplo, CARTO (CartoDB), software español para mapas; pero a nivel de clientes, nosotros casi siempre trabajamos con empresas grandes. Digamos que la inmensa mayoría de empresas que se acercan a trabajar con nosotros son empresas de una determinada cantidad de empleados, y sobre todo estamos viendo que el sector financiero se está moviendo mucho, porque tienen un cierto miedo de quedarse atrás, en todo el tema del Fintech. El sector automotriz también se está empezando a mover.

¿Qué tan importante es la visualización de los datos en proyectos con iniciativa de Big Data?

No solemos hacer muchos proyectos relacionados con Big Data, pero en los que hemos estado y estamos, que tienen gran cantidad de información, nos planteamos la visualización prácticamente de igual manera que nos la planteamos cuando no es Big Data. Al fin y al cabo, tus restricciones físicas son las mismas y tu capacidad de absorber información a través de metáforas visuales es la misma, con lo cual intentamos hacer un trabajo de ingeniería y de optimización de datos, antes de llegar a la interfaz de presentación y que esta interfaz de presentación no pretenda visualizar el mundo sino visualizar un universo filtrado con una suficiente calidad como para que la gente no se vuelve loca.

La Visualización y el Big Data es algo que, yo realmente todavía no he visto, que alguien me haya enseñado un proyecto donde haya podido salvar las barreras físicas. Me refiero al número de pixeles que tienes en una pantalla; puedes tener una pantalla muy grande pero no vas a poder analizarla porque vas a tardar mucho tiempo en recorrerla; yo creo que todo lo que es relacionado con cantidad es un trabajo de ingeniería, que debes quedarte con un subconjunto que sea digerible por el sistema visual.

¿Cuáles son los parámetros básicos a la hora de construir o plasmar la data de forma gráfica y visual y que apoye al proceso de toma de decisiones?

Todo pasa por hacer un análisis previo. Identificar dónde la visualización de datos te está ayudando para construir esa visualización y publicarla para que, el trabajo que has hecho de análisis previo, la gente ya no lo tenga que hacer. Es decir, nosotros no hacemos un gráfico que de repente sale bien a la primera y lo publicamos. Nosotros utilizamos la visualización como la utiliza todo el mundo: para descubrir cosas que no son mostradas analizando la tabla o que te llevaría mucho tiempo. Una vez que has descubierto eso que te ha hecho aprender algo, lo que quieres es transmitir esa historia al usuario y entonces es cuando ya intentas construir una interfaz que permita transmitir la historia; esto sería una de las dos grandes estrategias que puedes utilizar.

La otra, que es lo llamado exploratory. Pones una interfaz lo suficientemente libre como para que sea el usuario el que vaya descubriendo sus propias cuestiones, y entonces ahí, ya lo que necesitas es diseñar algo que sea muy modulable para que cada uno haga las combinaciones que quiera, y sea fácil, porque el usuario de la visualización por lo general es un público no técnico, con lo cual, tienes que hacer cosas que se entiendan bien. Si tienes que invertir unos segundos en entender lo que te dicen, el gráfico no está funcionando bien. Si yo creo un gráfico que nunca has visto en tu vida, vas a invertir un tiempo, primero en identificar cómo funciona el gráfico y después en encontrar algo. Como no tengo mucho tiempo de atención de la gente, no me puedo permitir el lujo, salvo que sea una cuestión artística. En el entorno corporativo, por ejemplo, nosotros trabajamos con un banco y uno de nuestros sistemas, lo consultan diariamente quince mil personas; si esas quince mil personas tienen que invertir 5 segundos cada una, en entender cómo funciona el gráfico, el banco está perdiendo muchísimo dinero.

Estas son las dos estrategias. La estrategia i[explanatory], la primera que te he contado y es la que utilizan mucho los medios de comunicación, que cuentan una historia y tu simplemente la digieres. La segunda que es la exploratory, es la que a mí más me gusta y es la que más se utiliza en el mundo corporativo.

¿Cómo el Data Scientist puede complementar su perfil con las técnicas de Data Storytelling?

Una de las cuestiones que yo siempre critico del mundo del Data Science, es que para mí, se ha cometido un error muy grande en pensar que todo se reduce a la técnica. Entonces gente como yo, con el perfil de economista, vemos como no nos toman en serio porque no somos ingenieros de software o físicos o matemáticos. Si bien es importante, porque el trabajo es evidentemente técnico.

A lo largo de mis ya 20 años, es decir, con mis estudios universitarios más la experiencia profesional y perteneciendo a una familia de empresarios, lo que ha hecho falta es que los llamados Data Scientists no saben de negocios y es muy difícil construir un producto basado en datos si no sabes del negocio.

Yo he aprendido a programar en los últimos años porque he visto que también a nivel profesional tenía que hacerlo, pero para mí, es igual de importante, saber hacer un modelo de predicción como saber acerca del funcionamiento de una empresa en todos sus departamentos. Creo que es importante que cuando la gente haga un proyecto, haga como, por ejemplo, hacen en Coca Cola. Cuando yo entré a trabajar allí, hace quince años, yo iba a trabajar en un departamento de control, pero mis dos primeras semanas en Coca Cola, fueron en todos los departamentos de la empresa, un día con logística, otro día estaba en ventas, otro en producción… y eso hace darte cuenta de que es mucho más fácil poder traducir las necesidades de negocio. Es muy difícil, desde una oficina encerrado a una pantalla de un ordenador, identificar cómo puedes optimizar la cadena de logística de la distribución de Coca Cola, por ejemplo.

En el caso en el que ahora nosotros trabajamos, es más complicado, porque al trabajar con empresas financieras, éstas tienen una forma muy diferente de trabajar. Entonces yo puedo tener mucho conocimiento de empresas de otros sectores, pero si voy a trabajar con un banco, debe tener conocimiento práctico de productos financieros. Yo tengo cierto conocimiento por mis estudios. En ese caso, lo que nosotros hacemos y, creo es muy interesante, es apoyarnos en el conocimiento que tiene el cliente y que el cliente se sienta muy importante y muy protagonista de la historia. Tú le vas a ayudar con tu conocimiento técnico pero el que mejor conoce los datos y el negocio es el cliente.




Nuevo comentario:
Facebook Twitter

Usted puede comentar o proporcionar más información a todos los artículos de este sitio. Los comentarios son libres y abiertos a todos. Sin embargo, nos reservamos el derecho a eliminar, sin previo aviso ni explicación, todo comentario que no cumpla con nuestras normas internas de funcionamiento, es decir, cualquier comentario difamatorio o sin relación con el tema del artículo. Así mismo, los comentarios anónimos son eliminados sistemáticamente si son demasiado negativos o muy positivos. Exprese sus opiniones, compártalas con los demás y asúmalas. Gracias de antemano. Igualmente, agradecemos tener en cuenta que los comentarios no sean enviados automáticamente a los redactores de cada artículo. Si usted desea realizar una pregunta al autor de un artículo, contáctelo directamente, no utilice los comentarios.


Twitter
Rss
LinkedIn
Google+
Facebook
Pinterest