Google desarrolla una inteligencia artificial capaz de predecir las lluvias de las próximas seis horas en menos de 10 minutos

Corría el año 340 a.C cuando Aristóteles, el conocido filósofo griego, escribió "Meterología", un tratado en el que se coqueteaba con las predicciones meteorológicas. Aristóteles creía que la meteorología era "todos los efectos que se pueden llamar comunes al aire y al agua y las formas y partes de la Tierra y los efectos de sus partes", y lo cierto es que tampoco iba muy desencaminado con el enfoque de la ciencia atmosférica.

Mucho ha llovido desde entonces y las predicciones meteorológicas han evolucionado, usándose imágenes multiespectrales, estaciones terrestres que miden el viento y las precipitaciones, radares Doppler que miden las precipitaciones en tiempo real... Pero ahora Google quiere ir más allá y aplicar la inteligencia artificial en la predicción de lluvias, y los primeros resultados de su "pronóstico inmediato de alta resolución" son de lo más interesantes.

Un vistazo a…
10 APLICACIONES de GOOGLE que PODRÍAN HABER TRIUNFADO

Inteligencia artificial para predecir las lluvias

Una visualización de predicciones hechas en el transcurso de aproximadamente un día. Izquierda: La predicción de HRRR de una hora realizada al final de cada, el límite de la frecuencia con la que HRRR proporciona predicciones. Centro: lo que estamos tratando de predecir. Derecha: las predicciones hechas por el modelo de Google.

De acuerdo a Google, "el pronóstico inmediato de alta resolución es una herramienta esencial necesaria para una adaptación efectiva al cambio climático, particularmente para el clima extremo". Desde la empresa ponen el ejemplo de tormentas localizadas o eventos que evolucionan en escalas de tiempo por hora, como podrían ser las tormentas eléctricas.

Su modelo de aprendizaje automático está pensado para abordar este tipo de eventos haciendo "predicciones altamente localizadas 'libres de física' que se aplican al futuro inmediato". La ventaja del modelo de aprendizaje automático es que, si ya existe un modelo capacitado, la inferencia es "computacionalmente barata" y los pronósticos son casi instantáneos. Google se enfoca en el pronóstico inmediato (aquel que contempla hasta las próximas seis horas) y su IA puede generar pronósticos con una resolución de un kilómetro cuadrado con una latencia de entre cinco y diez minutos, incluyendo en ese lapso de tiempo la recolección de datos.

Apuntan desde Google que la existencia de lluvia está relacionada con la existencia de nubes, pero que "no está perfectamente correlacionada". Asimismo, explican que los datos de radar provienen de estaciones terrestres y no suelen estar disponibles en los océanos, además de que la cobertura varía geográficamente. Así, Google ha optado por una aproximación "libre de físicas basada en datos". ¿Qué quiere decir eso?:

"Significa que la red neuronal aprenderá a aproximar la física atmosférica solo a partir de los ejemplos de entrenamiento, no incorporando el conocimiento a priori de cómo funciona realmente la atmósfera [...].

Dada una secuencia de imágenes de radar para la última hora, predecimos cuál será la imagen de radar dentro de N horas a partir de ahora, donde N típicamente varía de 0 a 6 horas. Dado que los datos del radar se organizan en imágenes, podemos plantear esta predicción como un problema de visión por computadora, deduciendo la evolución meteorológica de la secuencia de imágenes de entrada".

Para ello, Google ha usado un tipo de red neuronal convolucional llamada U-Net. Estas tienen una secuencia de capas dispuestas en fase de codificación que disminuyen la resolución de las imágenes que pasan a través de ellas. Posteriormente, en una fase de decodificación, estas representaciones de baja resolución se expanden a resoluciones más altas.

Estructura general de la U-Net de Google.

El input de U-Net es una imagen que contiene un canal por cada imagen de satélite multiespectral. Por ejemplo, si introducimos en el modelo diez imágenes satélite tomadas con diez longitudes de onda diferentes en la última hora, la entrada del modelo es una imagen de 100 canales.

Google, para el caso, entrenó la red a partir de observaciones históricas en los Estados Unidos desde 2017 hasta 2019. Los datos se dividieron en períodos de cuatro semanas, donde las tres primeras semanas se usaron para entrenamiento y la cuarta semana para evaluación. Posteriormente, los resultados fueron comparados con el pronóstico de tres modelos tradicionales: High-Resolution Rapid Refresh (HRRR) de NOAA, un algoritmo de flujo óptico y un modelo de persistencia.

El problema de los algoritmos de flujo óptico es que intentan rastrear objetos en movimiento a través de una secuencia de imágenes y, en el caso de las precipitaciones, se asume que las cantidades generales de lluvia en grandes áreas son constantes durante el tiempo que dura la predicción. El modelo de persistencia, por su parte, se basa en las condiciones de hoy para pronosticar las de mañana. "Puede parecer un modelo demasiado simplista para comparar, pero es una práctica común dada la dificultad de la predicción del clima", explican desde Google.

Izquierda: Predicciones para lluvia ligera. Derecha: Predicciones para lluvia moderada.

Los resultados se dispusieron en una gráfica de precisión y recuperación. Las predicciones de Google son la línea azul y, dado que Google no tiene acceso directo al modelo HRRR y que ni el modelo de persistencia y ni el algoritmo de flujo óptico tienen capacidad para intercambiar precisión y recuperación, sus predicciones se representan con puntos.

"Como se puede ver, la calidad de nuestro pronóstico de red neuronal supera a estos tres modelos (ya que la línea azul está por encima de todos los resultados de los otros modelos)", apuntan desde Google, que reconocen que "es importante tener en cuenta que el modelo HRRR comienza a superar nuestros resultados actuales cuando el horizonte de predicción alcanza aproximadamente las cinco o seis horas".

Sin embargo, afirman que una de las ventajas de su modelo es que "las predicciones son efectivamente instantáneas", mientras que HRRR tiene una latencia computacional de una a tres horas. En otras palabras, el modelo de Google es más efectivo para predicciones a muy corto plazo, mientras que el modelo HRRR es más eficaz a largo plazo

Más información| Google

Ver todos los comentarios en https://www.xataka.com

VER 9 Comentarios

Portada de Xataka