Una red neuronal analiza millones de imágenes para aprender cómo ha de ser un buen selfie

Podemos amar u odiar los selfies pero de lo que no hay duda es que son populares a partes iguales entre quienes los hacen y quienes investigan las imágenes para entender las claves de estos autorretratos. Hace tiempo vimos un proyecto que buscaba analizar una base de datos para analizarlas y ver qué hace que sean tan especiales. Ahora, un nuevo estudio decide ir más allá y crear una red neuronal para investigarlos a fondo.

Andrej Karphaty, un estudiante de doctorado en Stanford, ha estado trabajando en un proyecto de red neuronal dentro del laboratorio de Visión Computerizada en esta universidad. Ahí ha sido capaz de entrenar a un sistema para que sea capaz de identificar imágenes, clasificar sus rasgos y además aprender a evaluar un buen selfie.

Karphaty decidió "alimentar" la red neuronal con 5 millones de imágenes etiquetadas con la palabra "selfie". Hecho esto realizó una criba para dejar solo aquellas en las que se veía una cara reduciendo así la cifra en 2 millones. Posteriormente, la red empezó a trabajar para aprender cómo eran las fotos, los rasgos que aparecían, el encuadre y una variable muy importante: los likes que tenían en las redes sociales.

Es importante matizar la introducción de este elemento en la evaluación de las imágenes porque es el que ha usado la red neuronal para aprender si una foto es buena o no. A más likes, el sistema entiende que lo que está viendo es de calidad. Una vez ha terminado de ver todas las caras, su creador decide lanzarle 50.000 imágenes nuevas que no ha visto nunca y las empieza a evaluar con los datos del primer estudio.

Así analiza imágenes una red neuronal

Para este estudio, se ha utilizado una red neuronal tipo ConvVent (convolucional en español). En 2015 es una de las tecnologías que más se ha utilizado en Visión Computerizada para ayudar a los sistemas a reconocer imágenes y aprender datos de ellas.

Este tipo de redes se caracteriza por ser sencillas: son capaces de repetir una acción una y otra vez hasta que termine de procesar todas las imágenes. Es rápida, apenas necesita unas milésimas de segundo para estudiar ca da foto. Además es eficaz, en comparación con los resultados que arrojan otros sistemas de redes como GoogLeNet por ejemplo.

La red y su aprendizaje arroja una serie de conclusiones: los selfies de las chicas triunfan y una foto es "mejor" cuando la cara ocupa al menos un tercio de la imagen. Los autorretratos individuales funcionan mejor que los grupales mientras que las condiciones de la luz son un detalle a tener en cuenta. Si no está bien iluminada, no es "buena".

El sistema de Karphaty es interesante pero la metodología que hay detrás tiene algunas lagunas. Utilizar los likes como medida para saber si una foto es buena o no plantea dudas: ¿cómo de importante es que esa foto pertenezca a una cuenta con muchos seguidores? ¿deja de ser buena una imagen porque su alcance es pequeño.

Mi duda sobre el machine learning que ha creado este ingeniero es el excesivo peso que le da a los likes como termómetro de si una imagen es buena o no. Su autor, eso sí, reconoce que no es la mejor medida pero siempre podemos recalibrar el sistema para que aprenda nuevos valores y no se quede con esta sola variable.

Si tenéis curiosidad, podéis escribir un tweet a @deepselfie en Twitter con una imagen para que os devuelva una evaluación de la imagen. Recordad que ya lleva analizadas más de 2 millones de imágenes aunque su tasa de precisión sigue siendo un poco baja, 60%.

Así analiza imágenes una red neuronal

Recibe "Xatakaletter", nuestra newsletter semanal

Explora en nuestros medios