Uno de los usos más comunes de la tecnología de aprendizaje automático son los sistemas de recomendación de las plataformas online: cada vez que Facebook privilegia una publicación sobre otra a la hora de mostrarla en tu 'newsfeed' o Twitter destaca un tuit en la sección "Por si te lo perdiste" de tu 'timeline', lo que vemos es el resultado de sistemas de recomendación basados en inteligencia artificial.
Investigadores de Google publicaron recientemente un artículo académico ("Recommending what video to watch next: a multitask ranking system") en el que ofrecen algunos detalles relevantes sobre el funcionamiento del sistema de recomendación de vídeos de Youtube, uno de los más relevantes y avanzados de la industria, y que destaca por su efectividad a la hora de retener la atención del usuario.
Al tratarse de un plataforma en la que una gran cantidad de usuarios suben cientos de horas de vídeo cada segundo, el funcionamiento de su sistema de recomendación ha de ser forzosamente diferente de los de otras plataformas de streaming como Spotify o Netflix, que cuentan con un catálogo estable y centralizado: la evaluación de datos y la generación de recomendaciones en tiempo real cobra una importancia mucho mayor en el caso del portal de vídeos de Google.
La clave: dos redes neuronales profundas
Hasta 2016, Youtube recurría a algoritmos que sencillamente recomendaban vídeos en base a un conjunto de varios criterios: duración del vídeo, número de suscriptores, número de veces que había sido compartido, etc. Sin embargo, hace 3 años Youtube empezó a adoptar las redes neuronales.
Ahora, el sistema de recomendación de vídeos de Youtube funciona como un embudo estructurado en dos etapas, cada una de ellas responsabilidad de una red neuronal distinta:
1) Generación de ítems candidatos: En esta fase, las opciones se reducen de millones a miles. Recurre a datos extraídos del historial de los usuarios para ofrecer un listado de vídeos que tenga en cuenta el filtrado colaborativo (¿qué otros vídeos han atraído la atención del resto de personas que ven vídeos similares a los de este usuario?, por ejemplo).
2) Clasificación: En esta fase, las opciones se reducen de miles a decenas. Este proceso asigna una puntuación a cada vídeo, la cual determina la visibilidad que tendrá el mismo a la hora de mostrar las recomendaciones cuando estemos usando Youtube.
Aspectos como su similitud con contenidos que hayamos visualizado anteriormente aumentarán la probabilidad de que aparezcan entre los primeros puestos, mientras que se reducirán si el vídeo ya fue recomendado antes y el usuario 'pasó' del mismo.
Otro factor que influye es la 'edad' del vídeo: para evitar un sesgo en favor del contenido más antiguo (el que más visitas y 'likes' acumula, al fin y al cabo), el sistema de recomendación favorece la presencia de contenido novedoso entre las recomendaciones.
Engagement y sesgos
Sin embargo, aun conociendo todos los factores que tiene en cuenta Youtube a la hora de generar sus recomendaciones, resulta imposible predecir los mismos con exactitud, porque las redes neuronales profundas van aprendiendo sobre la marcha, alterando ligeramente sus resultados para cumplir con el objetivo básico con el que fueron creadas: en este caso, aumentar el 'engagement' (es decir, la retención del usuario frente a la pantalla).
De hecho, Youtube ha tenido que realizar cambios en su IA en los últimos tiempos, por el incentivo perverso que estaba demostrando ser esa búsqueda del engagement a toda costa. Hace unos meses abordamos cómo esta política había llevado a muchos usuarios a 'engancharse' a contenidos pseudocientíficos y conspiranoicos.
Guillaume Chaslot, ex-trabajador de Google y asesor del Center for Humane Technology, cuenta la historia de un conocido, "Brian", que encontraba en esa situación:
"Para sus padres, familiares y amigos, su historia es desgarradora. Pero desde el punto de vista de la IA de YouTube, es un gran éxito. Diseñamos la IA de YouTube para que aumentara el tiempo que las personas pasan online, porque eso conlleva más anuncios. La IA considera a Brian como un modelo que debe multiplicarse".
"¿Cuántas personas como Brian son seducidas por esas 'madrigueras de conejo' todos los días? Por diseño, la IA intentará captar a la mayor cantidad posible. [...] Por lo tanto, si 'la tierra es plana' mantiene a los usuarios más tiempo on line que 'la tierra es redonda', esa teoría se verá favorecida por el algoritmo de recomendación".
Vía | Towards Data Science (y II) & Vantage AI
Imagen | Public Domain Pictures
Ver 19 comentarios