César Hidalgo: “Transformo datos en historias, con una parte de ciencia y una de arte”

Opciones de Texto

Desarrolla herramientas capaces de convertir en narrativas enormes cantidades de información desde un mar de datos conocido como Big Data, donde es capas de “leer” patrones en múltiples y heterogéneas interconexiones, efectuando gravitantes predicciones aplicables a sistemas naturales, sociales y económicos. 

 

Marzo 2016

César Hidalgo (34) habla muy rápido. Quizás demasiado para los ojos de un observador casual pero pronto sus palabras comienzan a hacer sentido y sus ideas capturan la atención de los asistentes al evento final del campamento de investigación B3 (Bits, Bots & Behavior), que reúne a estudiantes del prestigioso Media Lab del Instituto Tecnológico de Massachusetts (MIT) con sus pares chilenos. Allí el científico nacional conversó con Explora sobre sus motivaciones, proyectos y las infinitas posibilidades de los datos, su principal línea de investigación.

“El Media Lab es un laboratorio de invención. Lo que buscamos es generar herramientas que produzcan un impacto positivo en el mundo”, cuenta el doctor en Física en la Universidad de Notre Dame (Francia) y profesor asociado de Ciencia y Artes Mediales del MIT, donde lidera el grupo de Macro Conexiones. Su labor se centra en comprender la evolución de la información en los sistemas naturales, sociales y económicos; además de desarrollar motores de visualización de enormes cantidades de datos, las que se hacen difíciles de manejar considerando el creciente volumen de información disponible (Big Data).

El físico formado en la Universidad Católica de Chile, quien vive en la ciudad de Somerville en el estado de Massachusetts junto a su esposa Anna y su pequeña hija Iris, acaba de lanzar el libro “Por qué la información crece” (Why Information Grows. Basic Books, 2015). Coescribió “Atlas de la Complejidad Económica” (The Atlas of Economic Complexity. MIT Press, 2014) y suma más de cinco mil citas en sus publicaciones académicas y 8 millones de visitas en sus motores de visualización.

Sistemas Complejos y Big Data

La definición de un sistema complejo señala que se compone de “varias partes interconectadas o entrelazadas cuyos vínculos crean información adicional”, que no era visible con anterioridad por el observador. De las interacciones entre los elementos “surgen propiedades nuevas que no pueden explicarse a partir de las propiedades de los elementos aislados”. Es decir, el todo es más que la suma de sus partes.

¿Cómo definiría usted un sistemas complejo?

Son sistemas que tienen muchas partes, donde todas son distintas. Son heterogéneos con patrones de conexiones que no son triviales, es decir, no como una grilla sino que hay nodos que están más conectados, otros poco vinculados, algunos que forman triángulos, unos solos, etc. Además tienen la capacidad de adaptarse y evolucionar.

Por ejemplo, las sociedades, la economía e incluso la manera en que se comportan las proteínas dentro de la célula son sistemas complejos. Estos no se pueden entender a través de promedios o los totales o los números simples. Si yo quiero hallar la diferencia entre un hipopótamo y otro animal de peso similar como un búfalo grande, si lo que tomo es su peso, porcentaje de agua en el cuerpo y de proteínas, no podría diferenciarlos.Pero si miro su genética y empiezo a ver estas cosas en mayor detalle, la heterogeneidad de las partes, cómo interactúan, de qué manera se conectan, cuál parte “prende” a un gen o lo “apaga” en un animal y el otro, ya en ese contexto voy a ser capaz de distinguirlos entre ellos.

¿Qué predicciones teóricas sociales se desprenden de los datos que analizas?

Hay cinco que hemos probado que son bastante fuertes, tres de ellas son sobre el desarrollo industrial de los países. La primera es que si uno sabe el set de productos que una determinada nación hace, uno puede predecir los que hará en el futuro; la segunda es que si además conozco qué tan complejos son esos bienes, uno consigue pronosticar qué nivel de ingresos tendrá y así cuál será el crecimiento próximo; la tercera es que con el mismo conocimiento basal, uno logra anticipar el nivel de desigualdad sufrirá. Esas tres predicciones son del mismo tema: si uno sabe qué productos genera un país, unos puede predecir qué va a hacer después, cuánto va a crecer y qué tan desigual es.

¿En qué área esto se hace más evidente?

En el ámbito de la evolución de la información, en una escala de tiempo más larga -no en los últimos 50 años sino que en los últimos miles de años- hemos sido capaces de demostrar que cuando los medios de comunicación cambian, se introducen transformaciones abruptas en la tasa de personas memorables que se recuerdan. Por ejemplo, antes de la invención de la imprenta no recordamos a casi ningún artista o científico; después de ella, evocamos a muchos científicos, artistas, pintores y compositores. Después de la creación de la televisión empezamos a retener actores, que existieron siempre desde la antigua Grecia, pero nunca fueron conocidos hasta el desarrollo de la pantalla porque no había un instrumento capaz de grabar la interpretación de una obra. Entonces los medios de comunicación transforman qué recordamos y qué tanto recordamos.

¿Cómo detecta narrativas en el mar de información que es el Big Data?

Transformo datos en historias, en eso hay una parte de ciencia y una de arte. En lo científico lo primero que trato de hacer es encontrar los patrones comparativos más simples en los datos que te puedan empezar a generar una historia. Porque no solo quiero generar una historia, sino que ésta sea lo suficientemente simple para que la gente entienda. Una manera de buscar esto es encontrando outlayers: al buscar tendencias, hay lugares, personas o grupos que se desvían de esa tendencia, y uno se empieza a preguntar por qué.

Muchas veces vas a buscar datos para explicar por qué sucede esto. La otra manera es generando herramientas de visualización que produzcan largas narrativas con muchos datos del mismo lugar, entidad o empresa, y al ver esas relatos como humano, uno empieza a hacer conexiones que no podría hacer si uno ve un gráfico solo, sino que ocurren entre las líneas al pasar de un gráfico a otro. Esto ayuda a extraer narrativas. Mientras que en la parte de arte, uno tiene herramientas, hay una sensibilidad, conoce algo contextual sobre ese sistema que te ayuda a darte cuenta cuál sería la pregunta interesante.

Chile en el Mundo. ¿Qué predicen los datos sobre la economía nacional?

Está anclada al precio internacional de los minerales, así que el futuro de la economía chilena es algo conocido. Además tiene una complejidad intermedia puesto que el recurso mineral es básicamente el que determina el nivel de ingreso y también el de desigualdad. Es importante entender en ese contexto que en Chile este último es bien alto, no solo por asuntos institucionales o culturales, sino que también porque el set de industrias que la nación tiene generan mucha riqueza con una cantidad de empleo muy baja, puesto que corresponden a industrias de capital intensivas. Es decir, con alta concentración del poder, al tener estructuras jerárquicas. No es lo mismo manejar una minera que en una empresa de software. En una mina requieres de un escalafón porque quieres que las personas respeten los protocolos de seguridad, los horarios, etc. En cambio en una compañía de software todo es más creativo y fluido.

A su juicio ¿Ha cambiado en algo esto en Chile en el último tiempo?

Yo veo que hay una parte importante de los chilenos, como la Generación X o los Millennials, que están empujando de distintas maneras el desarrollo de industrias no tradicionales en el país. En ese punto Chile no tiene nada que envidiarle a otras latitudes.

¿Cuál es su análisis de la memoria colectiva chilena?

Nosotros la vemos de una manera bastante estrecha porque la ordenamos empíricamente basándonos en las personas que nacieron en un país que son globalmente famosas. Entonces, la memoria colectiva de Chile incluye a Pablo Neruda, Iván Zamorano, Marcelo Ríos, pero también incluye a Pinochet y Allende. Si uno se sube a un taxi en Moscú o en Tokio, en general los tres personajes chilenos que conocen son Neruda, Pinochet y Allende. De cierta manera los individuos que son reconocidos globalmente te cuentan cuál es la narrativa de esa nación y eso es lo que queda en el recuerdo colectivo.

Son las cosas que por un lado nosotros guardamos en los medios de información, pero por otra parte son aquellas que repetimos en los actos de comunicación, y esa reproducción es una medida cuantitativa de lo que es la fama. La memoria colectiva de Chile está centrada en la política, el deporte y la escritura; acorde al nivel de desarrollo cultural que tenemos, que es intermedio. Este país no ha generado científicos famosos, inventores o cineastas célebres, porque nuestro desarrollo cultural es en las categorías más comunes, las más fáciles de alcanzar. Todos los países tienen un político famoso, por ejemplo Zimbabwe con Mugabe, Sudáfrica con Mandela, también hay escritores; Colombia con García Márquez… pero ¿conocemos un científico famoso de Colombia? No todavía.

¿Se debe así al nivel de desarrollo del país? ¿Y qué rol juega la ciencia?

Hay una escalera de desarrollo cultural que va de las formas culturales más simples y comunes a las más complejas; los países que están más arriba en esta escalera son naciones que ya tienen un output muy grande en las formas más simples, se encuentran en un estadio de desarrollo más alto que nosotros. De hecho, hay una ley logarítmica que dice que si tú vas a ser un país que va a producir un científico, por cada uno de ellos vas a tener 10 escritores afamados; y por cada 10 hombres de ciencia gloriosos vas a engendrar un inventor famoso. En un dataset que hicimos de personas famosas en el mundo de acuerdo a Wikipedia, de 11.334 personas listadas, Chile tenía 27.