The New York Times, The Guardian, la BBC, El País… Todos los grandes medios de comunicación generalistas han introducido en el último año módulos visuales y análisis de datos que buscaban y rebuscaban tendencias que ayudaran a interpretar la evolución de la pandemia por COVID-19 que trastocó toda nuestra vida hace ahora poco más de un año.
Y, en la mayoría de casos, estos grandes diarios se han servido de una misma fuente para representar datos como el número de muertes, contagios o vacunación: el portal Our World in Data.
Editado por profesionales de la Universidad de Oxford, Our World in Data se ha erigido como la web de referencia para seguir la evolución de la enfermedad gracias a la ingente cantidad de datos, gráficas y comparativas entre países que en gran medida también nos ha sepultado informativamente en este tiempo. Un trabajo hecho y publicado bajo licencia Creative-Commons.
Y todo empezó para ellos con un PDF. Al menos en lo relativo a la COVID-19.
“Al inicio, en marzo de 2020, nos dimos cuenta por ejemplo que la OMS publicaba la información sobre la pandemia en archivos PDF imposibles de procesar y con algunas inconsistencias. Así que para los investigadores era muy difícil acceder a la información. También vimos que en el tema de datos sobre tests PCR había un vacío que nadie estaba llenando. Por ahí empezamos, y hemos seguido, ahora por ejemplo también con datos sobre vacunación”.
Quien habla es Esteban Ortiz-Ospina, economista colombiano de 37 años que desde 2016 es el Jefe de Operaciones de la publicación, que ha destacado por conseguir curar las diferencias de datos que ofrecen los distintos países y ofrecer así una información más comparable y nítida.
“Investigación y datos para avanzar en los mayores problemas del mundo”, el eslogan de OWiD
Sin embargo, antes de que el equipo de OWiD advirtiera de los problemas en la difusión de datos sobre la COVID-19 que tenían las fuentes oficiales para investigadores y periodistas, el suyo había sido un trabajo a fuego lento, creando un portal sobre datos y grandes tendencias en la humanidad de largo recorrido que, en cierto modo, no requerían de la inmediatez de los datos de la pandemia.
El proyecto, de hecho, nació en 2014, cuando Max Roser, economista alemán, empezó a elucubrar sobre la visión que tenía la gente del mundo.
Así, por ejemplo, más allá de la COVID-19, su portada referencia a grandes tendencias estadísticas como la evolución de la mortalidad infantil, de la riqueza mundial, o la esperanza de vida. Todas han ido a mejor si lo miramos en una perspectiva de varias décadas. Y otras, como el promedio de obesidad mundial o la concentración de CO2, claramente a peor. En total, desde 2014 OWiD ha ido añadiendo y actualizando en su web más de 3100 gráficos de casi 300 temas distintos.
OWiD nació con la misión de ofrecer una visión de conjunto de la evolución de los problemas globales a través de datos y análisis
“El objetivo principal siempre ha sido examinar los datos y la investigación para avanzar en los mayores problemas del mundo. Entender dónde se ha avanzado (lo que a menudo requiere observar las tendencias históricas y los cambios lentos), pero también comprender dónde quedan los grandes problemas y qué podemos hacer para resolverlos”, cuenta a Xataka Roser, fundador del portal.
En el fondo, el origen de OWiD tuvo como misión ofrecer una visión de conjunto de la evolución de los problemas globales en contraposición a los medios, donde las noticias del día a día muchas veces opacan todo lo demás.
En su web ponen un ejemplo bastante claro: “El número de personas que viven en la pobreza extrema se redujo de cerca de 2.000 millones en 1990 a 700 millones en 2015. En ningún día de este periodo de 25 años el titular de ningún periódico del mundo ha sido "El número de personas en situación de extrema pobreza se redujo en 137.000 desde ayer". Y ello a pesar de que -en promedio- este habría sido un titular acertado todos los días durante estos 25 años”.
Los árboles no nos dejan ver el bosque, tal cual dice el proverbio.
Una organización sin ánimo de lucro en una de las mayores incubadoras de startups
El germen de Our World in Data fue para Roser en inicio publicar un libro que recogiera parte de estas tendencias que creía que no tenían cabida en el relato del día a día. Pronto se dio cuenta de que aquello tendría una mayor trascendencia en formato web, y al empezar a trabajar como investigador en la Universidad de Oxford encontró como padrino a Sir Tony Atkinson. Fallecido en 2017, Atkinson había sido uno de los economistas que más había ahondado en los últimos años en el estudio de la pobreza o, lo que es lo mismo, el reparto de la riqueza.
La primera versión de la web surgió definitivamente a finales de 2014 tras un apoyo de la fundación Nuffield, lo que permitió que el proyecto pudiera pagar sus primeros sueldos y afrontar en 2015 lanzar su propia plataforma de visualización de datos. En la actualidad son unas 12 las personas que trabajan en el día a día de OWiD, entre investigadores, científicos de datos y programadores de back y front-end.
La web está ahora bajo el paraguas de Global Change Date Lab, una fundación creada específicamente para conseguir financiación para su mantenimiento, y en 2018 llegó a ser una de las pocas organizaciones sin ánimo de lucro admitidas en la conocida incubadora de startups Y Combinator. Para hacerse una idea, por ella han pasado Airbnb, Dropbox o Stripe.
"Cuando empiezas un proyecto como este, y pones tanto trabajo y esfuerzo a nivel personal y profesional, necesitas tener cierta confianza en que las cosas pueden salir bien. De lo contrario, no invertirías tanta energía, tiempo y dinero. Pero, por supuesto, muchos proyectos no acaban teniendo éxito. Por eso con OWiD estamos muy contentos por lo que hemos conseguido, pero quizá todavía más con lo que pueda venir por delante”. Max Roser, fundador de Our World in Data.
Y de las grandes tendencias estadísticas, a la vorágine de la pandemia
Antes de que la pandemia cambiara nuestras vidas, Our World in Data ya era una web conocida y referenciada por miles de medios. Sin embargo, su trabajo con los datos de la COVID-19 la han llevado a un nivel de exposición mucho mayor.
Eso sí, esto es algo que podría no haber ocurrido nunca. “Hace un año -con el comienzo de la pandemia en Europa- debatimos profundamente si debíamos aportar cobertura sobre la pandemia”, nos relata Ortiz-Ospina.
Unos datos tan cambiantes como los del coronavirus se alejaban quizá del foco de grandes tendencias y debates con el que nació OWiD, pero pronto se dieron cuenta de que la COVID-19 iba a ser uno de los problemas más grandes del Planeta.
“En gran medida, el trabajo sobre COVID-19 se convirtió en carga adicional a lo que ya teníamos programado. Y de hecho estamos muy satisfechos de habernos podido posicionar como un referente en COVID-19, y al mismo tiempo haber logrado cumplir todas nuestras metas en los otros temas”, cuenta el investigador colombiano.
OWiD refleja hoy datos de más de 200 países sobre la pandemia, estandarizando los datos de distintas fuentes
Les preguntamos por el reto que ha supuesto y también las herramientas tecnológicas que han usado para manejar semejante cantidad de datos. OWiD refleja hoy datos de más de 200 países sobre la pandemia, algo que lógicamente solo se puede hacer tras estandarizar y limpiar la información que ofrece cada Ministerio local. El siguiente gráfico es buen ejemplo. Muestra la relación de test realizados por casos confirmados. España cuenta con un pico anómalo que coincide con la decisión del Gobierno de cambiar la forma de contabilizar las pruebas.
“Para las actualizaciones de datos usamos una combinación de scripts para automatización y validación, junto con recopilación y revisión manual”, señala Ospina, quien coordina el día a día de un equipo que trabaja completamente en remoto y desde distintos lugares del mundo.
El trabajo que hace que todos aquellos datos se vayan actualizando lo antes posible es una mezcla de asimilación de datos de terceros que a veces llegan por vía de API, repositorios de GitHub compartidos por otros grupos de investigación y, en los casos más laboriosos, de procesado y revisión casi manual.
“La información sobre muertes y casos confirmados la actualizamos usando datos de Johns Hopkins University. Pruebas PCR y vacunación actualizamos nosotros directamente, y en estos casos hay procesos extra de revisión y validación”, afirman. El tratamiento de los datos es aquí una parte vital de su trabajo. Estandarizarlos, diferenciar entre países que cuentan por ejemplo entre personas vacunadas o dosis de vacunas distribuidas, y también descartar fuentes que no parecen adecuadas. “Cuando recopilamos datos sobre la vacunación contra el COVID-19 y hacemos hincapié en las diferencias entre países, la idea es ampliar nuestro enfoque e ir más allá de los problemas inmediatos en lugares concretos”, dice Roser.
“Para algunos temas esto requiere mucho esfuerzo y atención constante. Edouard Mathieu, quien lidera la recopilación de datos sobre vacunación en nuestro equipo, ha tenido que trabajar todos los fines de semana para mantener los datos al día”, nos sigue contando Ortiz-Ospina.
El reto de visualizar y difundir los datos. Y hacerlo todo sin ánimo de lucro y con licencia abierta
En el camino hasta aquí OWiD también ha pasado por problemas financieros. “Hubo momentos en los que tenía que pagar a mis colegas investigadores tirando de ahorros”, comenta Roser. En 2015, el proyecto estuvo en riesgo, pero un crowdfunding les dio impulso para continuar un año más.
Hoy en día, las cuentas de OWiD están más saneadas. En 2019 consiguieron medio millón de libras con donaciones, muchas de particulares, y otras de mayor peso como las de la fundación de Bill y Melinda Gates.
“Hoy por hoy tenemos reservas suficientes para garantizar autonomía por un tiempo, y hacer planes de mediano plazo; pero no podemos parar de hacer fundraising. Creo que esta es la realidad de toda organización sin ánimo de lucro, y más aún bajo el modelo de financiación que tenemos”, señala Ortiz-Ospina.
Todos sus gráficos, informaciones y trabajos están registrados bajo licencia Creative Commons CC-BY license, y su software de visualización de datos así como los scripts que usan para el tratamiento de la información están disponibles en GitHub.
Imagen | https://www.vperemen.com
Ver 2 comentarios