Ahora podemos ver cómo 'piensa' un algoritmo

Hay una vieja viñeta de Sidney Harris en la que un investigador trata de explicar a otro una demostración matemática. El segundo investigador dice "Creo que podrías ser un poco más explícito en el paso dos" y, efectivamente, en la pizarra sólo se puede leer "y entonces ocurre un milagro".

Siempre que me hablan de las redes neuronales artificiales para procesar datos me acuerdo de esta viñeta porque es la mejor metáfora de lo que son: una enorme caja negra que hace cosas sorprendentes, pero que no sabemos cómo funciona con exactitud. Hasta ahora, que un grupo de investigación alemán ha creado una metodología innovadora para "ver cómo piensan los algoritmos".

Las redes neuronales se vuelven populares

En los últimos años y gracias a las redes neuronales, nos hemos vuelto muy buenos procesando grandes cantidades de datos y buscando patrones concretos en ellos. El funcionamiento de las redes neuronales artificiales está inspirado en el funcionamiento de nuestro propio cerebro. Se trata de un conjunto de 'neuronas artificiales' (cada una especializada en una cosa) que se relacionan y cooperan entre ellas para procesar la información.

Es precisamente eso, esa forma de trabajar juntas y generar resultados, lo que no conocemos con exactitud. No porque sea un misterio técnico, sino porque la principal virtud de las redes es que cambian y se adaptan a la información a la que se enfrentan. Es decir, porque (como los sistemas neuronales que tratan de imitar) cada red neuronal es única.

A diferencia de otras formas de afrontar problemas de programación, las redes neuronales se entrenan enfrentándolas con el problema que tienen que resolver. Si queremos que identifique enfermedades en una radiografía, tendremos que darle cientos de radiografías con esa enfermedad. Esa forma autónoma de aprender es su potencial.

Las entrañas de la caja negra

Su potencial y su principal problema. No sabemos qué criterios o factores tienen en cuenta para tomar sus decisiones. Esto hace que, de hecho, no sepamos por qué toman las decisiones. Y no es un tema menor: estos algoritmos están detrás de cada vez más aplicaciones que van desde identificar las fotos en las que sale una persona a descubrir la clave de la cura contra el cáncer.

Las primeras aplicaciones de este nuevo método de la Sociedad Fraunhofer, dejan claro los problemas asociados. En el ejemplo podemos ver cómo un algoritmo que aparentemente identifica trenes sin problemas, en realidad lo que está detectando son los raíles. La muestra de imágenes de ferrocarril con la que entrenamos al algoritmo estaba sesgada.

En otro caso, el algoritmo que estudiaron identificaba fotografías de caballos. Curiosamente con esta metodología, los investigadores descubrieron que el algoritmo no sabía identificar el cuerpo de un caballo, sino que se fijaba en los metadatos de la imagen y señalaba aquellas que tenían como origen foros de internet relacionados con el mundo de los caballos.

Consecuencias y metodologías

Y esto tiene consecuencias desagradables. Si ponemos a una red neuronal a seleccionar candidatos para un puesto de trabajo usando como referencia a los anteriores candidatos seleccionados, lo más probable es que reproduzca las desigualdades sociales, raciales o de género que ya existen.

Si aprendemos como piensan, no solo podremos detectar este tipo de problemas, sino que podremos aprender a mejorar nuestras metodologías. Saber qué detalles son interesantes para un diagnóstico, qué criterios son más eficientes para seleccionar personal o qué indicadores parecen potentes, pero en realidad no lo son.

Aunque la presentación oficial será a finales de mes, el método utiliza las series de Taylor, un sistema de aproximación de funciones. Este sistema permite descomponer los resultados de las redes usando los inputs para ello y se puede aplicar sin necesidad de entrenar las redes previamente.

Ver todos los comentarios en https://www.xataka.com

VER 7 Comentarios

Portada de Xataka