Inteligencia de negocios y big data para el mundo hispano parlante.

¡Subscríbase al boletín gratuito!


Inteligencia de Negocios en Español - Decideo.com





Entrevistas

Carlos Carrasco Farré, de EIXOS: "lo bueno del Data Science y Big Data es que podemos seguir jugando como cuando éramos niños"


, el 21 Octubre 2017 | Leído 3186 veces

Carlos Carrasco Farré es Chief Data Scientist en EIXOS e investigador en IESE Business School. Ha estudiado en universidades como la Universitat Pompeu Fabra, The Johns Hopkins University, London School of Economics & Political Science (LSE) y Harvard University. Su trabajo se centra en la intersección entre el análisis de datos, la toma de decisiones y la dirección de organizaciones. En esta entrevista comparte cómo combina sus dos roles, el de investigador con el de científico de datos, porqué hay que jugar los datos, y además nos cuenta sobre el proyecto de Smartcity con el presupuesto más grande de la unión europea, y hace un llamado a prestar atención no solo a la cantidad sino también a la calidad de los datos.



Carlos Carrasco Farré, de EIXOS: "lo bueno del Data Science y Big Data es que podemos seguir jugando como cuando éramos niños"
-¿Cuándo inicias en el mundo de los datos?
Carlos Carrasco Farré, ha publicado diferentes publicaciones académicas y ha participado en libros sobre economía, gestión y estrategia urbana. Adicionalmente es lecturer en diversas universidades donde imparte clases sobre Data Science y desde el inicio de su carrera laboral, empieza a involucrarse en el mundo de los datos:

"Empecé a trabajar primero para una empresa de consultoría, después para una administración pública en el área de desarrollo económico, en la subárea de evaluación de políticas públicas y lo primero que me di cuenta, fue que, a pesar de ser el departamento de desarrollo económico, -y en la subárea- los datos que teníamos eran realmente malos, no se podía trabajar con ellos. A partir de allí me di cuenta de la importancia que tenían los datos".

Es como hacia el 2012, Carlos Carrasco empieza a interesarse por el tema de no solamente tener más datos sino mejores datos para la toma de decisiones. De allí surge la empresa EIXOS, donde asume el rol de Chief Data Scientist. "Empecé a investigar cómo trabajaban otras administraciones y otras empresas. Me empecé a dar cuenta de que los datos, a pesar de que todo el mundo era consciente de lo importante de tener datos y de analizarlos, nadie realmente los tenía de muy buena calidad".

-¿Cómo combinas el rol de investigador con el de Chief Data Scientist y qué hay en común entre ellos?
"No es una combinación muy difícil, en el sentido que el IESE es una escuela de negocios y EIXOS trata el desarrollo económico de las ciudades, por lo que hay un campo común, al menos en el campo de análisis es muy parecido, siempre en entorno a la economía y a la producción económica de las ciudades". Es lo que indica Carlos Carrasco cuando le preguntamos acerca de los dos roles que posee en estas dos organizaciones, donde no considera que sea una combinación complicada por tratarse siempre de temas relacionados alrededor de la economía y de la promoción económica. Igualmente adiciona "además es algo que observo muy a menudo, es decir, hay muchísimos Data Scientist que o bien han sido investigadores puramente académicos, o bien combinan las dos vertientes, la académica y la comercial con más impacto en el mundo real a través de empresas".

-¿Cómo nace el Centro Cities in Motion del IESE Business School?
Desde ya hace más de 4 años, Carlos Carrasco trabaja con el IESE Business School cuyo departamento de estrategia define cambiar el análisis económico de cara a las empresas, el cual siempre se había llevado a cabo a nivel de país.

"Es decir, siempre se analizaban países, las tendencias de los países, los problemas, etc. El problema es que el mundo empezó a cambiar y la gente se empezó a dar cuenta de que las ciudades empezaban a cobrar mucha más importancia y en algunos casos casi al mismo nivel que el país y sobre todo para estrategias empresariales, especialmente si los países son muy grandes, por ejemplo, Estados Unidos, puedes analizar la productividad a nivel país, pero es muy diferente una ciudad de la costa este, una de la costa oeste, una del centro, una más rural, una más urbana, etc. Por lo que se requería fijar las nuevas estrategias empresariales con un poco más de granularidad, un poco más de detalle en este aspecto…", explica el investigador del IESE Business School, Carlos Carrasco Farré.

"De aquí nació el Centro Cities in Motion del IESE Business School, que está centrado sobre todo en el análisis de ciudades y más específicamente lo que nosotros llamamos Smart Governments, la gestión inteligente de las ciudades, gracias a toda la nueva oleada de tecnologías que tenemos disponibles y como esto cambia la gestión de las ciudades".

A nivel europeo, el Centro Cities en Motion trabaja muy de cerca con Barcelona y Madrid, Colonia en Alemania, Estocolmo en Suecia y Cork en Irlanda. Están comenzando un caso de estudio con Medellín y además han realizado casos de estudio con Vancouver, Singapur, por citar algunos ejemplos.

-¿Qué se analiza en el IESE Cities in Motion Index?
Como institución académica, el IESE Business School, realiza publicaciones científicas, publicaciones en revistas académicas, publicaciones mucho más técnicas enfocadas a un público más académico. Pero adicionalmente cuenta con un pilar divulgativo que incluye publicaciones orientadas a un público más general, como a la ciudadanía o medios de comunicación, pero igualmente a decisores del sector público o directivos empresariales o públicos… Carlos Carrasco señala, "por tanto, en este sentido hacemos publicaciones periódicas más divulgativas con un lenguaje no tan complicado, más adaptado a la audiencia. En este apartado , la publicación más destacada es el índice anual que sacamos de ciudades; se llama IESE Cities in Motion Index en el que analizamos más de 180 ciudades de todo el mundo con más de 80 variables en 10 dimensiones diferentes que cubren desde economía, cohesión social, movilidad, proyección internacional, entre otras. Esta publicación es gratuita y ya vamos por la cuarta edición, de hecho, tiene un impacto mediático bastante grande a nivel global. Al analizar todas estas 180 ciudades en más de 10 dimensiones diferentes nos permite identificar, por ejemplo, qué ciudades lideran el ranking de economía o de cohesión social, etc. A partir de estas variables podemos entrar en contacto, con más profundidad, en por qué estas ciudades lideran el ranking y por qué las otras están al final del ranking, qué problemas tienen y cuáles no están solucionando. Al final sirve como una herramienta de toma de decisiones de tipo estratégicas, no tanto para solucionar problemas específicos que tienen quizás una solución muy técnica, sino más para, por ejemplo, directivos públicos o privados que quieren tomar decisiones basadas en datos o estar un poco más informados de qué buenas prácticas existen alrededor del mundo en sectores específicos, en los que su ciudad o su empresa puede estar teniendo problemas".

-¿Qué proyecto bandera trabajan en el marco del Cities in Motion?
"Ahora mismo el proyecto más destacable que tenemos básicamente por magnitud y tamaño, es el proyecto europeo GrowSmarter, el proyecto de Smartcity con el presupuesto más grande de la unión europea. Son 25 millones de euros, que están destinados a testar nuevas tecnologías en Barcelona, Colonia en Alemania, y Estocolmo en Suecia. Tecnologías que se están testando en tres grandes pilares: sostenibilidad en edificios públicos y privados, movilidad eficiente y finalmente integración de datos e infraestructuras urbanas. Cada ciudad está testando tecnologías específicas y nuestro papel en este proyecto es evaluarlas".

-¿Cómo te conviertes en Chief Data Scientist en EIXOS?
"Esto empezó porque básicamente, mi socio es arquitecto con especializaciones tecnológicas especialmente en urbanismo y en visualización de datos urbanos. Observamos muy rápidamente que uno de los grandes problemas que tienen muchas ciudades alrededor del mundo es el tema del comercio, de la vitalidad de las calles, la actividad económica a pie de calle, que se refiere a toda actividad económica donde la gente accede desde la calle ya sea a los supermercados, restaurantes, tiendas de ropa, etc. Esto en muchísimos países del mundo y en muchas ciudades es un gran motor de empleo, un gran motor de economía, a través de impuestos, de riqueza en general, pero las administraciones tienen poca información al respecto".

"Lo que hicimos fue cubrir esta falta de información a través de la creación de lo que nosotros llamamos un sistema de crowdsourcing para recolectar la información necesaria y a partir de allí analizarla a través de nuestros algoritmos, tanto de cálculo como de visualización para que la toma de decisiones, tanto en el sector público como en el sector privado, se haga con la mayor eficiencia y en el menor tiempo posible".

-¿Qué respuestas de negocio resuelve los métodos de analítica espacial de EIXOS?
"Nosotros tenemos dos grandes grupos de clientes:

Uno es en el sector público, en donde trabajamos o bien con el departamento de promoción económica, por cuestiones obvias. En este sentido, estos departamentos suelen pedir qué tipo de negocios tienen, dónde tienen disponibilidad de espacios comerciales que no se están ocupando, por qué, entre otros. También, con los departamentos de urbanismo, en el momento que quieren edificar en alguna zona o promover determinadas actividades en una zona, o temas de transporte público, dónde se necesita, cómo el transporte público afecta esta actividad económica o cómo esta actividad económica se beneficia del acceso de transporte público.

En el sector privado, trabajamos desde la apertura de nuevos puntos de venta, dónde está la competencia, dónde existen nichos de mercado, dónde existen áreas con alta actividad económica con grandes flujos de personas, hasta temas de comercialización. Normalmente las empresas saben dónde se están comercializando sus productos, pero no tienen la más mínima idea de cuántos clientes potenciales tienen".


-¿Por qué la importancia de la calidad de los datos en el análisis espacial?
"Lo que es muy importante en análisis espacial…nosotros siempre hablamos de la calidad de nuestros datos… no solo por la fiabilidad sino por la desagregación de estos datos, porque están desagregados a nivel de edificio. Es decir, podemos decir, en este edificio hay este restaurante que se llama X y esta tienda de ropa que se llama Y, de forma que no cometes los errores, que en spatial analytics se llama el boundary problem, que es cuando tienes una delimitación, por ejemplo, administrativa, un barrio, si las estadísticas te la dan a nivel de barrio puede ser que la actividad económica se concentre justo entre la frontera entre los barrios y por lo tanto cada uno de estos dos barrios, al quedar esta actividad partida en dos, y contabilizada en dos unidades diferentes, estas unidades pueden parecer poco atractivas, con mapas, estos problemas no pasan…cuando en realidad si miras sobre el mapa se ve muy claro, con mapas de calor, la concentración de actividad económica. Básicamente esto es lo que hacemos, trabajar para el sector público en temas de promoción económica y urbanismo, y para empresas privadas, para nuevas aperturas o cierres de puntos de venta, es decir, calibrar que puntos de venta es más interesante cerrar y cuáles no, o para comercialización de productos y campañas marketing".

Carlos Carrasco Farré, de EIXOS: "lo bueno del Data Science y Big Data es que podemos seguir jugando como cuando éramos niños"
-¿Qué tipología de algoritmos trabajan?
"Tenemos dos tipologías de algoritmos. Siempre trabajamos con tecnología abierta, software libre, a partir de aquí, esto nos permite, que al ser una startup, y no tener mucho presupuesto para destinar a desarrollos, nos permite trabajar con algoritmos que ya ha desarrollado mucha gente para otros proyectos. Evidentemente esto requiere de cierta adaptación al tipo de datos o tipo de análisis que nosotros hacemos, pero ya no partimos de cero.
Pero también desarrollamos algoritmos a medida para temas muy específicos que trabajamos con los clientes, matching de bases de datos diferentes, las de nuestros clientes con las nuestras, para validarlas, esto se hace con algoritmos creados internamente. Recolectamos la información mínima que necesitamos para identificar un negocio, a través de nuestros colaboradores, mediante un teléfono, Smart pone o Tablet van caminando y tomando nota de ciertos campos muy específicos de lo que ven en la calle. Nosotros después en la oficina, enriquecemos esta base de datos, por ejemplo, diciendo, la tienda Zara, es una tienda de ropa, multinacional, que pertenece a esta misma cadena que pertenece a estas x calles, el enriquecimiento se hace después en oficina".


EIXOS trabaja ayudando a muchos municipios, desde el propio Ayuntamiento de Barcelona, que por cierto, fueron quienes crearon el dataset para ellos, el cual está en el portal de datos abiertos y el cual se puede descargar para que la gente haga sus propios análisis y sus propias aplicaciones.

EIXOS trabaja con muchas ciudades y diversas multinacionales alrededor del mundo. Ahora, por ejemplo, ha empezado un proyecto con el área metropolitana de Barcelona, son más de 40 municipios alrededor de Barcelona, para analizar su estructura comercial.

-¿Cuáles son las responsabilidades como Chief Data Scientist en EIXOS?
"Dirigir los análisis y dirigir el equipo de analistas que está formado por perfiles muy diferentes: desde urbanistas hasta programadores informáticos, arquitectos, economistas, incluso también hemos trabajado con ingenieros nucleares … perfiles muy variados. La tarea es básicamente hacer el puente entre estos perfiles tan técnicos y el cliente. Mi tarea es un poco, la digamos de traductor, entre el cliente que habla un lenguaje empresarial y los analistas que hablan un lenguaje científico; y muchas veces entre ellos no se entienden. El cliente pide una cosa, el analista entiende otra o el analista explica una cosa en forma tan técnica que el cliente no entiende, o no sabe traducir en decisiones específicas empresariales o del sector público, y mi tarea es un poco es controlar los análisis, revisarlos también y después, esta traducción entre estos dos mundos que es el del análisis de datos y el de toma de decisiones".

-¿Qué es lo que destacarías de la economía basada en los datos?
"Esto daría para muchas horas de entrevista, pero lo que yo destacaría, la ventaja de toda esta nueva economía que se ha dado alrededor de los datos, es la mejora en la toma de decisiones. Es decir, las decisiones se venían tomando con un peso muy importante de lo que llamamos conocimiento implícito, es decir, la experiencia que tiene un directivo, su intuición, las charlas que mantiene, las visitas en sitio que realiza a lugares, a fábricas, tiendas, etc., Estas ahora pueden ser complementadas, y no sustituidas o al menos no en la mayoría de los casos, con información o conocimiento que llamamos explícito, en contraposición al conocimiento implícito del que hablaba antes. Contraposición en complementariedad al conocimiento implícito de los directivos".

"Esto permite que un directivo a la hora de tomar la decisión puede tener un apoyo o que bien le ratifique o bien le matice su intuición, su decisión que ya podía tener tomada y permita que esta decisión vaya generando resultados con una mayor probabilidad de éxito. Reducimos la incertidumbre y por tanto reducimos el margen de error o las posibilidades de error a través de complementar el conocimiento implícito de los directivos con el conocimiento explícito del análisis de datos. Evidentemente existen sectores, especialmente en decisiones más operacionales, donde directamente este conocimiento explícito, a través de los datos sustituye completamente las decisiones de un directivo. Por ejemplo, en temas de store, en tiendas si se está terminando un producto en la tienda, no hace falta que el directivo se encargue de estar pendiente, estar atento, cuando quedan pocas, llamar al centro de logística a pedir que mande más, sino que un algoritmo relativamente muy sencillo puede encargarse de cuando solo quedan dos productos, automáticamente mandarle un aviso. La decisión del directivo va desapareciendo o la intervención humana ha desaparecido".

-¿En qué situaciones crees tú que los algoritmos sí podrían competir con el conocimiento humano?
"Básicamente los campos en que los algoritmos pueden competir con el cerebro humano son muy parecidos a los campos en el que la mecanización o la robotización de tareas compitió en su momento con el trabajador manual. Es decir, en el momento en que aparecen máquinas que son capaces de hacer tareas muy rutinarias y muy repetitivas, y determinados puestos de trabajo, determinados perfiles laborales desaparecen. Con los algoritmos pasa un poco lo mismo. Hay algunas decisiones, sobre todo ligadas a temas operativos, de logística, de la cadena de suministros, u otros, que sí son susceptibles de ser reemplazados por algoritmos. En cambio, otros, funciones más directivas, más estratégicas, más de innovación, es más difícil que sean sustituidos, lo que sí, es que serán complementados con algoritmos, pero de momento, no serán sustituidos. A veces dicen, nunca un algoritmo podrá sustituir un gran compositor, aunque se empiezan a ver pruebas de determinadas empresas que juntando y analizando los gustos de las personas, con canciones, ritmos, letras, etc., son capaces de crear, digamos, la canción perfecta".

-¿Bajo tu visión como Chief Data Science, qué es lo más importante: ¿los datos o los algoritmos?
"Sin duda los datos. En esto hay mucha discusión entre diferentes ramas o vertientes del data science o big data. Básicamente mi argumento es que al final hay una frase en inglés que me gusta mucho usar es: "Garbage in Garbage out". Si le introduces dentro del algoritmo basura, por muy bueno que sea el algoritmo acabará saliendo algo no muy bueno. Es muy parecido a una trasfusión de sangre, es decir, que si la sangre es de mala calidad o no sirve para mi organismo, porque es sangre que puede funcionar más para otro organismo, a pesar de que me la pongan, el resultado no va a ser muy bueno. Es muy parecido con lo que pasa con los grandes cocineros, es decir un gran cocinero de primera línea, puedes escoger al mejor del mundo, y seguro que, si le das un tomate podrido, seguro que algo puede agregar, pero si me das el mejor tomate del mundo seguro que te hará el mejor plato del mundo. En ese sentido, un algoritmo sería como un cocinero, el mejor cocinero del mundo, el mejor algoritmo del mundo con malos datos nunca generará resultados tan buenos como con buenos datos".

-¿Qué etapas se requieren en la toma de decisiones basadas en datos?
"En realidad, no es tanto un modelo lineal, en el que tu introduces los datos por un lado y salen los resultados por el otro. Primero hay que conectar los lados, cuál es la necesidad, cuál es la pregunta que tratamos de resolver. Entonces si puedes introducir los datos y orientarlos hacia esa respuesta que estás buscando. En este sentido tienes dos vías: o bien vías más exploratorias, en el que, en los algoritmos o cálculos, no especificas exactamente qué es lo que debe hacer, sino que le dices explora, qué relaciones existen, qué patrones encuentras y a partir de ahí veremos si tienen sentido. Por otro lado, si la pregunta es muy específica o muy concreta, sí que puedes guiar más al algoritmo y decirle, qué es lo que exactamente me están preguntando, lo que es un problema muy acotado. Entonces si puedes que el algoritmo vaya directamente a solucionar ese específico problema. Si las preguntas son más generales, del estilo: por qué mi tienda de esta calle vende más que la otra, donde influyen una multitud de factores, es necesaria una aproximación un poco más general y más holística, que tenga en cuenta multitud de factores para encontrar, ya no solo una respuesta sino poder decir, influyen todos estos factores con esta determinada importancia".

"No es tanto una cadena de montaje del coche, donde vas montando piezas y acaba saliendo un coche. Sino es más un proyecto, digamos explorador. En este sentido, y de hecho es una de las buenas vertientes de tipología de trabajo, y es que cada día es diferente porque no estás produciendo siempre lo mismo. Estás explorando, mirando qué es lo que sucede. Nosotros en nuestra compañía dejamos que nuestros trabajadores jueguen con los datos sin ningún proyecto específico o cliente específico, si han ido a conferencias, han leído alguna investigación… nos ha parecido esto interesante y vamos a ver qué pasa si lo aplicamos a estos datos… con este juego y esta curiosidad digamos, muy ligada como cuando éramos pequeños, la curiosidad de qué pasa si junto esto con esto, que cuando después de mayores la solemos perder. lo bueno del Data Science y Big Data es que podemos seguir jugando como cuando éramos niños."

Carlos Carrasco Farré, será ponente del Big Data Congress en Barcelona, del próximo 24 y 25 de octubre, con su ponencia titulada: Big Data VS Bad Data: de la cantidad a la calidad de los datos.
i"[En mi ponencia hago una llamada a la comunidad a pensar no solo en la cantidad de los datos, que es importante sin duda, sino también en la calidad de los datos. En muchas de las conferencias de las que vemos, todo el mundo habla de big data pero después cuando tu hablas con la industria, cuando hablas con gente que lo está intentando realmente, uno de los problemas, de hecho si no es el primero, es el segundo problema, citan que a la hora de implementar todas estas soluciones, es básicamente que los resultados o los datos no son fiables. Por tanto, les impide tomar una decisión basada en estos datos, precisamente porque a pesar de tener muchísimos datos, muchas veces no son nada fiables"]i.

-¿Cómo lograr tener datos confiables?
"El cómo, lo hemos solucionado básicamente en lo que sería la evolución humana. Si nos fijamos un poco, el hombre empezó como cazador recolector. Digamos, corriendo detrás de la presa o moviéndose según las estaciones para llegar a árboles frutales que estaban por esa época del año. Se iba moviendo como recolectores. Nosotros lo que proponemos es dar un paso más y pasar de recolectores a cultivadores. Es decir, a crear : pensar qué es lo que queremos, qué es lo que necesitamos y crear expresamente esos datos con la mayor calidad posible, es decir, que no dependas de factores externos sino que nosotros decidamos qué factores nos interesan. A partir de ahí, creemos los datos. Por eso, hacía un símil con la agricultura, de pasar de recoger las manzanas que voy encontrando, algunas pueden ser buenas, otras pueden ser malas; en cambio si yo controlo la producción de las manzanas, yo me aseguraré de que sean de la mayor calidad posible".

"Para esto se requiere una visión y una estrategia muy clara de qué es lo que queremos y para qué lo queremos. Es importante que esta visión esté respaldada por una necesidad de mercado, evidentemente, es decir, alguien después tendrá que consumir estos datos (estas manzanas) pero después, desarrollar toda una serie de técnicas, procesos y metodologías para garantizar al máximo esta calidad y además también evidentemente teniendo en cuenta, el precio, el coste de la producción".




Nuevo comentario:
Facebook Twitter

Usted puede comentar o proporcionar más información a todos los artículos de este sitio. Los comentarios son libres y abiertos a todos. Sin embargo, nos reservamos el derecho a eliminar, sin previo aviso ni explicación, todo comentario que no cumpla con nuestras normas internas de funcionamiento, es decir, cualquier comentario difamatorio o sin relación con el tema del artículo. Así mismo, los comentarios anónimos son eliminados sistemáticamente si son demasiado negativos o muy positivos. Exprese sus opiniones, compártalas con los demás y asúmalas. Gracias de antemano. Igualmente, agradecemos tener en cuenta que los comentarios no sean enviados automáticamente a los redactores de cada artículo. Si usted desea realizar una pregunta al autor de un artículo, contáctelo directamente, no utilice los comentarios.


Twitter
Rss
LinkedIn
Google+
Facebook
Pinterest