Uno de los usos más comunes de la tecnología de aprendizaje automático son los sistemas de recomendación de las plataformas online: cada vez que Facebook privilegia una publicación sobre otra a la hora de mostrarla en tu 'newsfeed' o Twitter destaca un tuit en la sección "Por si te lo perdiste" de tu 'timeline', lo que vemos es el resultado de sistemas de recomendación basados en inteligencia artificial.
Investigadores de Google publicaron recientemente un artículo académico ("Recommending what video to watch next: a multitask ranking system") en el que ofrecen algunos detalles relevantes sobre el funcionamiento del sistema de recomendación de vídeos de Youtube, uno de los más relevantes y avanzados de la industria, y que destaca por su efectividad a la hora de retener la atención del usuario.
Al tratarse de un plataforma en la que una gran cantidad de usuarios suben cientos de horas de vídeo cada segundo, el funcionamiento de su sistema de recomendación ha de ser forzosamente diferente de los de otras plataformas de streaming como Spotify o Netflix, que cuentan con un catálogo estable y centralizado: la evaluación de datos y la generación de recomendaciones en tiempo real cobra una importancia mucho mayor en el caso del portal de vídeos de Google.
La clave: dos redes neuronales profundas
Hasta 2016, Youtube recurría a algoritmos que sencillamente recomendaban vídeos en base a un conjunto de varios criterios: duración del vídeo, número de suscriptores, número de veces que había sido compartido, etc. Sin embargo, hace 3 años Youtube empezó a adoptar las redes neuronales.
Ahora, el sistema de recomendación de vídeos de Youtube funciona como un embudo estructurado en dos etapas, cada una de ellas responsabilidad de una red neuronal distinta:
1) Generación de ítems candidatos: En esta fase, las opciones se reducen de millones a miles. Recurre a datos extraídos del historial de los usuarios para ofrecer un listado de vídeos que tenga en cuenta el filtrado colaborativo (¿qué otros vídeos han atraído la atención del resto de personas que ven vídeos similares a los de este usuario?, por ejemplo).

2) Clasificación: En esta fase, las opciones se reducen de miles a decenas. Este proceso asigna una puntuación a cada vídeo, la cual determina la visibilidad que tendrá el mismo a la hora de mostrar las recomendaciones cuando estemos usando Youtube.
Aspectos como su similitud con contenidos que hayamos visualizado anteriormente aumentarán la probabilidad de que aparezcan entre los primeros puestos, mientras que se reducirán si el vídeo ya fue recomendado antes y el usuario 'pasó' del mismo.
Otro factor que influye es la 'edad' del vídeo: para evitar un sesgo en favor del contenido más antiguo (el que más visitas y 'likes' acumula, al fin y al cabo), el sistema de recomendación favorece la presencia de contenido novedoso entre las recomendaciones.
Engagement y sesgos
Sin embargo, aun conociendo todos los factores que tiene en cuenta Youtube a la hora de generar sus recomendaciones, resulta imposible predecir los mismos con exactitud, porque las redes neuronales profundas van aprendiendo sobre la marcha, alterando ligeramente sus resultados para cumplir con el objetivo básico con el que fueron creadas: en este caso, aumentar el 'engagement' (es decir, la retención del usuario frente a la pantalla).
De hecho, Youtube ha tenido que realizar cambios en su IA en los últimos tiempos, por el incentivo perverso que estaba demostrando ser esa búsqueda del engagement a toda costa. Hace unos meses abordamos cómo esta política había llevado a muchos usuarios a 'engancharse' a contenidos pseudocientíficos y conspiranoicos.
Guillaume Chaslot, ex-trabajador de Google y asesor del Center for Humane Technology, cuenta la historia de un conocido, "Brian", que encontraba en esa situación:
"Para sus padres, familiares y amigos, su historia es desgarradora. Pero desde el punto de vista de la IA de YouTube, es un gran éxito. Diseñamos la IA de YouTube para que aumentara el tiempo que las personas pasan online, porque eso conlleva más anuncios. La IA considera a Brian como un modelo que debe multiplicarse".
"¿Cuántas personas como Brian son seducidas por esas 'madrigueras de conejo' todos los días? Por diseño, la IA intentará captar a la mayor cantidad posible. [...] Por lo tanto, si 'la tierra es plana' mantiene a los usuarios más tiempo on line que 'la tierra es redonda', esa teoría se verá favorecida por el algoritmo de recomendación".
Vía | Towards Data Science (y II) & Vantage AI
Imagen | Public Domain Pictures
Ver 19 comentarios
19 comentarios
Usuario desactivado
Youtube se ha convertido en una plataforma para colar publicidad a lo bestia, suelo ver documentales cuando ve voy a la cama y hay veces que es insufrible, ayer mismo en un docu de 45 minutos colaron publicidad intermedia 5 o 6 veces... es el T5 de internet.
Usuario desactivado
Como extraño los vídeo recomendados y relacionados de hace una década, cuando en verdad eran propuestas relevantes. Claro, en ese entonces las recomendaciones eran curadas por los mismos usuarios de YT...
Billy
Yo llevo años diciendole a Youtube que no me interesa ElRubius y sigue recomendándolo, algo no funciona.
Usuario desactivado
Alguien tendría que enseñarle a las redes neuronales que las fechas importan en según que temas. Algunos videos ya los veo en modo incognito, porque como se te quede un video en el historial de ciertas temáticas como procesadores, gpus, etc... te empieza a bombardear con videos relacionados y le importa un huevo la fecha.
Sí youtube, he mirado un video sobre los Ryzen 3 o sobre gpus con RTX, no quiero que me recomiendes videos sobre pentuim 4, o la gtx 280, no me interesa la tecnología obsoleta.
xolan
Pues esas redes neuronales deben "pensar" con el xxxxx, solo me sugieren artistas de reguetón.
Usuario desactivado
No seria genial que Youtube y similares hiciera recomendaciones basadas unicamente en el mas puro y simple azar?
rocketboom
Se me ha ocurrido una idea!
Pero la kagada es que no soy programador ni tengo plata pa pagar uno 😞
zenstt
"el sistema de recomendación favorece la presencia de contenido novedoso entre las recomendaciones."
Youtube: "Eh, hay un vídeo de hace 8 años de algo que tiene un mínimo de parecido con lo que mira, vamos a encasquetárselo por 3 semanas en la pantalla principal."