El verano pasado el equipo de ciencia de datos de Alto Data Analytics dio inicio, con ocasión del Día Mundial del Aseo, a un proyecto destinado a "comprender la crisis mundial del agua".
Recurriendo a datos abiertos proporcionados por Dollar Street, un proyecto web destinado a divulgar los efectos de la desigualdad que ofrece en su web imágenes de las condiciones de vida reales de familias de todo el mundo, organizadas por niveles de ingresos.
Según cuenta Clarissa Watson, jefa de marketing de la compañía, sus analistas
"modelaron un análisis de reconocimiento de imagen de inodoros impulsado por inteligencia artificial, para obtener de manera más veloz y automatizada un número más exacto de personas afectadas por condiciones de saneamiento inseguras a escala global".
"Tras procesar 971 imágenes [con el software TensorFlow de Google], probaron la capacidad del algoritmo para identificar inodoros según los grupos de ingresos. Luego utilizaron las herramientas de Gapminder para analizar los datos y comprender mejor qué proporción de la población mundial utiliza instalaciones sanitarias inseguras".
¿Cuál fue el resultado de dicho análisis? La IA desarrollada por Alta Data Analytics no fue capaz de reconocer como inodoros aproximadamente 1 de cada 3 de los mismos (concretamente, el 30,3%).
Cuando los analistas de la compañía comprobaron qué tenían en común las imágenes que la IA no era capaz de identificar, pudieron comprobar que el grueso de las mismas se concentraba en la categoría de familias de bajos ingresos:
Los aseos de familias con ingresos por debajo de los 122,5 dólares mensuales (categoría en la que se sitúa el 30,3% de la población mundial) sencillamente no eran reconocidos por la IA.
Mientras, los aseos de las familias cuyos ingresos se situaban por debajo de los 245 dólares mensuales (47,8% de la población) tenían tan sólo un 50% de probabilidades de ser reconocidos.
Este ejercicio constituye una evidencia del importante papel que los datos abiertos y la inteligencia artificial ostentan a la hora de generar un conocimiento que pueda desembocar en cambios sociales.
Para Watson, a medida que los datos se democratizan las organizaciones deberán dedicar más recursos a establecer estrategias de datos y a desbloquear información socialmente relevante.
Imagen de portada | Glenn Beltz
Ver 17 comentarios