“El mayor defecto de la raza humana es nuestra incapacidad de entender la función exponencial”. Con esa frase, empezaba Al Bartlett, profesor emérito de la University de Colorado en Boulder, una de sus conferencias más famosas y la verdad es que, más allá del exceso retórico, la dificultad de los seres humanos para entender bien cómo funcionan los fenómenos exponenciales es un tema recurrente de la enseñanza de la estadística.
De la estadística y, como estamos viendo estos días, también de la epidemiología. ¿Tenemos algún instrumento que nos ayude a entender mejor este tipo de crecimientos? Por suerte, sí.
La curva exponencial que arruinó a un rey

En 1256, Ibn Khallikan escribió, por primera vez, la historia que hoy conocemos como la leyenda de Sisa. Cuenta la leyenda que hace muchos siglos en algún punto indeterminado al noroeste de la India, había un rey tan rico y poderoso que había perdido la capacidad de apreciar los placeres que le rodeaban. Aburrido, un día llamó a su sirviente más inteligente, Sisa, y le pidió que creara un juego para él. Sisa creó el ajedrez.
El rey, agradecido, le permitió escoger la recompensa que que prefiriera y Sisa solicitó solamente que le pagaran un grano por el primer cuadrado, dos por el segundo, cuatro por el tercero y así sucesivamente hasta llegar a la sesenta y cuatro de las casillas que conformaban el tablero. El rey aceptó, claro. De hecho, le pareció una ridiculez de recompensa para un juego tan maravilloso. El pobre rey no sabía la que se le venía encima.
No sabemos qué pasó con Sisa, pero sí sabemos que el Rey no pudo pagar su deuda. Como señalaba Bartlett, la cifra total eran 400 veces toda el trigo que se produjo en 1990. Es decir, que posiblemente la humanidad en toda su larga historia no ha llegado aún a producir todo el trigo necesario para saldar la factura del inventor del ajedrez.

Este ejemplo clásico nos ayuda a entender lo contraintuitivas que son las funciones exponenciales. Algo que, de hecho, está ocurriendo estos días con la crisis del coronavirus. Vistas en su conjunto, las epidemias no tienen un comportamiento exponencial. Y no lo son porque, en un sistema finito, a partir de cierto momento la misma estructura social limita su crecimiento: no hay suficientes humanos en el mundo para mantener ese crecimiento exponencial.
Su comportamiento se explica mejor con un refinamiento de la curva exponencial, lo que conocemos como curva logística. Eso quiere decir que, aunque no todo el crecimiento es exponencial, sí hay tramos de la evolución que lo son. De hecho, por lo que sabemos sobre la importancia de las medidas rápidas, en las fases más críticas del brote ese comportamiento es exponencial.
¿Cómo podemos identificar mejor ?

La mayoría de gráficas que vemos en los medios siguen una escala lineal. Por eso, las curvas que trazan los países son "exponenciales"; es decir, crecen cada vez más rápido. El problema es que, viendo este tipo de gráficos es muy difícil saber cómo es el crecimiento: si comparamos la evolución de Italia con la de Estados Unidos, Alemania o Francia podría parecer que estos últimos no tienen de qué preocuparse. Lamentablemente, con la información visual que hay en esa tabla no solo es imposible decir eso, sino que es dificilísimo calcular la evolución futura de cada uno de los países. No podemos saber si el crecimiento en esos países es exponencial.
Sin embargo, en cuanto pasamos los datos a una escala logarítmica la situación cambia. A estos efectos, cuando hablamos de escala logarítmica hablamos de una gráfica en la que la distancia entre países con 100 y 1.000 casos es la misma que entre países con 1.000 y 10.000, porque el tiempo que se necesita para pasar de unos a otros es el mismo. Con este tipo de gráficas es muy fácil identificar un fenómeno exponencial porque los datos dibujan una línea recta.

En esta gráfica, se ve con claridad que Francia, Alemania y EEUU están en situaciones muy parecidas a Italia o España (pero en una fase previa). Lo único que hace falta para ver si el crecimiento exponencial se ha detenido es comprobar si la curva del país dejar de dibujar una línea recta.
¿Por qué no usamos esta escala de forma habitual? Ese es uno de los grandes debates de la visualización de datos. Por un lado, la logarítmica nos permite identificar mejor los fenómenos exponenciales; por el otro, no estamos habituados a interpretarlas. En realidad, cada una de las escalas ofrece información distinta. Y resulta difícil construir visualizaciones que sean capaces de unir lo mejor de cada una (manteniendo la claridad de las mismas) porque, en el fondo, todo depende de las respuestas que queramos tener y del momento en el que hacemos las preguntas. En este momento, todo indica que las respuestas fundamentales las responde mejor la logarítmica.
Imagen | Thisisengineering Raeng
Ver 10 comentarios
10 comentarios
Hechs
La escala lineal mostrando curvas de gran crecimiento es visualmente más impactante, aunque menos útil para comparar fuentes de datos distintas, que la escala logarítmica. Es otra cara del clickbait, la presión por impresionar a primera vista.
¡Buen articulito, por cierto!
Moon under water
Y de ahí viene el verbo sisar
kolmogorov
De hecho, en el análisis de datos lo más habitual es realizar transformaciones logarítmicas (generalmente de logaritmos neperianos, aunque con cualquiera los resultados son equivalentes) para evitar problemas asociados a grandes cantidades de datos (que hoy en día se usa mucho con técnicas de Machine Learning y Scoring). Realmente supone un análisis más dentro de toda la batería de estudios que se realizan para obtener los resultados que se buscan. Por lo que es donde resulta relevante que se utilicen las dos gráficas (la lineal y la logarítmica), ya que enriquece en gran medida los resultados del análisis.
Otra historia es cómo mostrarlo al gran público, ya que no todo el mundo entiende de matemáticas y, mucho menos, de estadística. Es una cuestión más de presentación y marketing. Pero, claro, el contexto en el que se muestran estos días estas gráficas de crecimiento es únicamente periodístico, por lo que no hay un exhaustivo estudio previo, al nivel de un paper o un informe científico, que sería lo más interesante y relevante en esta situación.
Y por cierto, que alguien lo comentaba, una curva logística existe, pero no es lo mismo que una curva logarítmica (aunque la regresión logística esté basada en logaritmos).
envit
No se comenta que el gráfico logarítmico es con base 10, y que existen tantas otras bases que modifican la pendiente del gráfico.
Interesante para la gente que no aprendió los logarítmicos en su momento, aunque muy mejorable el artículo.
relectron
"...como curva logística."
???????
lihuelrc
Muy buena la nota, pero en realidad nadie sabe quien inventó el Ajedrez.