¿Puede una máquina adivinar la edad que tienes mirando una foto tuya? Eso es precisamente lo que Microsoft intentó hace meses con ese experimento viral llamado How-Old.net que formaba parte de una iniciativa mucho más ambiciosa: el llamado Project Oxford.
En ese proyecto se engloban una serie de APIs destinadas a desarrolladores, y en todas ellas hay un apetito voraz por nuestros datos. Nuestra cara, nuestra voz y nuestros contenidos son vitales para "entrenar" a esos sistemas de reconocimiento, pero es inevitable preguntarse si esa glotonería tiene fines que van más allá de lo especificado por Microsoft.
La inteligencia artificial hecha juego
Si uno se da un paseo por el sitio web oficial de Project Oxford puede ver rápidamente cómo las APIs disponibles son muy variadas y abarcan temas relacionados con la visión -reconocimiento de caras y emociones-, el habla -reconocimiento y síntesis de voz- o el idioma -lenguaje natural, corrección ortográfica-.
La mayoría de esas APIs no son demasiado concocidas, pero por ejemplo las relacionadas con el reconocimiento facial o el reconocimiento de emociones fueron muy llamativas por los experimentos que Microsoft hizo a partir de ellas.
Cuatro han sido los llamativos experimentos virales: How-Old.net, el detector de emociones, el que nos encontraba un hermano gemelo perdido y el peculiar MyMoustache.net.
La polémica surgió casi desde el primer momento. Lo de que a partir de una foto un sistema de inteligencia artificial tratara de adivinar tu edad llamaba mucho la atención, pero casi nadie se había dado cuenta de que había letra pequeña en aquella simpática iniciativa de Microsoft llamada How-Old.net.
En los términos de uso generales de los servicios de Microsoft se descubrían unas condiciones ciertamente inquietantes en este sentido:
Microsoft no reclama la propiedad de los materiales que proporcionas a Microsoft (incluyendo comentarios y sugerencias) ni de los que publicas, subes, introduces o envías a cualquiera de sus Servicios o sus servicios asociados para ser vistos por parte del público general, o por miembros de cualquier comunidad pública o privada, (cada uno entendido como un "Envío" y colectivamente "envíos").
Sin embargo al publicar, subir, introducir, proporcionar o enviar ("Publicar") tu Envío estás cediéndole a Microsoft, sus empresas afiliadas y a sus sublicencias necesarias el permiso para que utilicen tu Envío en relación con la operativa de sus negocios en Internet (incluyendo, sin limitaciones, a todos los servicios de Microsoft), incluyendo, sin limitaciones, los derechos de licencia para: copiar, distribuir, transmitir, mostrar públicamente, actuar públicamente, reproducir, editar, traducir y cambiar el formato de tu Envío; para publicar tu nombre asociado a tu Envío; y el derecho para subrogar dichos derechos a cualquier proveedor de los Servicios.
Esos términos resultaron ser tan preocupantes que las quejas del respetable pronto quisieron ser acalladas en Redmond. Un portavoz de la compañía pronto contactó con los medios para explicar que en aquel caso en particular Microsoft "no comparte ni almacena imágenes o información personal identificable".
Los responsables de Project Oxford nos hablan sobre la privacidad de estos servicios
Aquella aclaración se tomó en cuenta en posteriores servicios, y vimos como en MyMoustache aparecía una casilla adicional (desactivada por defecto) en la que podíamos "donar nuestra foto para la ciencia" -además de explicar la magia tras el experimento-. En TwinsOrNot los ingenieros de Microsoft también advertían de que solo usarían nuestras fotos para el juego "a menos que nos digas que podemos quedárnoslas para mejorar [el servicio]". Tanto en How-Old.Net como en el último de los experimentos que vimos, Emotion Recognition, aparecía un mensaje claro indicando que "no nos quedamos con las imágenes en esta demo".
Pudimos aclarar aún con más detalle este aspecto tras contactar con el equipo de Project Oxford y en concreto con Ryan Galgon, uno de sus responsables. Este ingeniero nos explicaba cómo en el caso de How-old.net "no se almacenan imágenes ni información personal identificable (PII). Se usan los términos de uso del sitio web de Microsoft Azure, que son similares a los términos de servicios online en el resto de la industria.
La inclusión de esa opción para "donar a la ciencia" esas imágenes o no hacerlo diferencia el tipo de gestión que Microsoft hace de las imágenes que subimos a esos experimentos. Como explicaba Galgon, Microsoft establece por defecto que no se recolecten imágenes para mejorar el servicio, "pero cuando es posible le damos a los usuarios la posibilidad de compartir las imágenes con Microsoft para mejorar estos modelos".
Aquí Galgon incidía en la relevancia que estas APIs pueden tener para los desarrolladores y detacaba que Microsoft establece un Código de Conducta "para ayudar a que los desarrolladores comprendan nuestras expectativas a la hora de proteger los datos que recolectan de la gente". Si decidimos habilitar la opción de compartir esas imágenes con Microsoft para que puedan ser usadas para mejorar el funcionamiento de estas APIs, estaremos sujetos a la Declaración de Privacidad de Microsoft, nos explicaba este investigador.
Se hace camino al andar
El aprendizaje automático en el que se basan todos estos experimentos tiene un problema: que necesita entrenamiento. Mucho. Ese es el motivo de ese voraz apetito del que hablábamos por parte de Microsoft y estos experimentos, que ciertamente tratan de que participe el máximo número posible de personas para que el sistema se alimente de su interacción y mejore.
Cuando Microsoft habló de Project Oxford hace un año dejó claro que todas estas herramientas estaban destinadas a desarrolladores que podrían aprovechar la capacidad de estas APIs "y no preocuparse sobre los aspectos relacionados con el aprendizaje automático".
El ejemplo lo ponían en aquel artículo: se podrían automatizar tareas costosas en tiempo, como por ejemplo descartar imágenes o contenido inapropiado o filtrarlo según parámetros que podrían establecerse por parte de los programadores. Pero sin un entrenamiento adecuado, estos sistemas de aprendizaje quedarían cojos. No se habrían "sacado el graduado escolar" y no serían especialmente útiles.
El argumento de Microsoft es por tanto coherente: si no nos dais datos, no podemos ayudaros (o ayudar a los desarrolladores), pero las suspicacias son igualmente coherentes e inevitables. En estos tiempos en los que la privacidad es moneda de cambio para todo tipo de proveedores de servicios -dejamos para otro día el "si no pagas por el producto, tú eres el producto"- lo que Microsoft haga o deje de hacer con nuestros datos preocupa.
Sobre todo porque la empresa de Redmond no ha acertado mucho en los últimos meses con el trato a sus usuarios. Esa obsesión por obligarnos a actualizar a Windows 10 y sobre todo las dudas respecto a la gestión de la privacidad y recolección de la actividad en este sistema operativo han hecho que muchos desconfíen de las buenas intenciones de esta empresa no ya en el ámbito de ese SO, sino en el de todos los servicios de Microsoft.
Cuando Microsoft nos ve la cara, solo ve eso, una cara
La preocupación entorno al uso de esos servicios es lógica con todo lo que ha pasado anteriormente, pero según Microsoft la utilización de nuestros datos en estas APIs y estos sistemas de inteligencia artificial está reservada al citado entrenamiento del sistema.
Así lo afirmaba Melissa Hovis, portavoz de Microsoft, en correos intercambiados con The Washington Post. En ellos explicaba que "Microsoft tiene procesos preparados para ayudar a deshacer cualquier identificación del contenido generado por el usuario en audio, vídeos, imágenes y otros datos cuando se procesan con las APIs del Proyecto Oxford".
Por ejemplo, añadía, "cualquier imagen proporcionada por una aplicación a la Face API se trata de forma que se le quitan todos los metadatos, los datos de sesión o las direcciones IPs asociadas para proteger la privacidad de la gente en esas imágenes".
Esa misma vocación por proteger nuestra privacidad y usar esas imágenes solo para mejorar el comportamiento de las APIs -adivinar mejor tu edad, reconocer mejor tus emociones, etc- también se hace respetar entre los desarrolladores, para los que Microsoft tiene una serie de estrictas indicaciones que se deben seguir a la hora de utilizar estas APIs en las aplicaciones que las aprovechen.
Todo ello hace pensar que efectivamente Microsoft no tiene intención de aprovecharse de nuestra cara cuando la subimos para "jugar" con estos experimentos. Visto lo visto asegurar que efectivamente Microsoft -ni ninguna otra- harán otras cosas con esas imágenes es imposible, pero si queréis evitar suspicacias tenéis una fácil solución: ni se os ocurra utilizar estos servicios o hacer caso de esos experimentos virales.
En Xataka | Por favor máquina, no me escuches tanto
Ver 21 comentarios