En el futuro será la línea de comandos: sobre los bots como las nuevas apps y el chat como el gran interfaz

Cada pocos años se produce en el mundo de la tecnología una suerte de búsqueda del oro, una sensación de que se ha encontrado “la siguiente gran cosa” en la que toda compañía tecnología “debería estar”.

A veces se trata de espejismo - Second Life, ¿Bitcoin? - en otras ocasiones el éxito es moderado - los tablets, la cuantificación - y también tenemos las verdaderas revoluciones: quien se quedó fuera del smartphone táctil, quien llegó tarde a eso, se quedó fuera de la computación móvil.

2016 no se iba a quedar sin su particular becerro de oro tecnológico. Llevamos unos meses de debate alrededor de los bots como las nuevas apps y de la conversación (el chat si no nos queremos poner tan trascendentes) como interfaz. Ahora que Nadella ha consagrado el futuro cercano de Microsoft a esta tendencia, cabe detenerse a analizarla y a intentar indagar en ello ¿estamos ante la gran nueva revolución tecnológica o ante un nuevo espejismo?

Con todos ustedes, les presento a mister bot

Bot viene de robot y viene a ser la versión software del mismo. Se trata de una aplicación desarrollada para realizar de manera autónoma diversas tareas. Así hablamos de bots en videojuegos (por lo general personajes controlados por la máquina), “crawlers” o indexadores como el que usa Google para detectar el contenido en la web o incluso lo utilizamos para referirnos a ordenadores “zombies” controladas por algún tipo de cracker y forman parte de una botnet.

Pero en esta ocasión nos referimos sobre todo a los “chat bots”, aquellos que permiten una interacción conversacional, también a la nueva ola de asistentes virtuales y a los programas capaces de articular acciones automáticas en estos entornos sociales.

Los más viejos del lugar quizás se hayan acordado de los bots del IRC. Como entonces hablamos de programas que se conectan a una plataforma social y conversacional y, dentro de ella, interactúan con humanos y prestan cierto tipo de servicios de forma automática.

Los bots no son nuevos en la computación: algunos recordarán los bots del IRC, pero todavía hay algunos más que vieron la luz hace décadas, como ELIZA

Podemos irnos todavía más atrás, si queremos señalar a un primer bot de esta especie nos deberíamos remontar hasta ELIZA, aquel con el que se quería desafiar al test de Turing hace ya unas décadas. Años después llegaron los bots a aquellas grandes plataformas de chat: además de a IRC, a MSN Messenger, AIM o a ICQ. El de más éxito fue a buen seguro smartchild, que hoy se estaría llevando los halagos de la prensa y el dinero de los inversores.

Partiendo de que como concepto esto de los bots no es nuevo, de que ya hubo una gran etapa de los mismos que pasó sin pena ni gloria por la historia de la computación y que todo esto nos suena a muy conocido ¿por qué tanto ruido alrededor de los bots?

Con todos ustedes, la conversación

Si tuviésemos que responder a la pregunta ¿dónde está el gran volumen, el mayor tiempo de uso y el mayor engagement en lo “social en internet” ahora mismo?, la respuesta no debería ser Facebook o Twitter, debería ser: las aplicaciones de mensajería.

Lo conversacional y la tecnología tienen una larga, muy larga, historia juntos. En el principio fue la línea de comandos, de hecho la línea de comandos lo era todo: el primer gran interfaz de la computación moderna.

Pasamos por diversas fases, en las que la línea de comandos es complementada y a la postre sustituida por los interfaces gráficos, y en la que el texto se mantiene y aparece de múltiples formas: desde las aventuras conversacionales en los videojuegos hasta el IRC y la era dorada de la mensajería en el PC.

Con la explosión móvil el texto no decae como forma de comunicación sino que crece de forma brutal (esta generación a la que se etiqueta como la más audiovisual es a la postre la que más lee y escribe de la historia) y evoluciona (por ejemplo, incorporando los emojis).

Desde la línea de comandos, pasando por el SMS, hasta las aplicaciones de mensajería actuales: la conversación escrita no se ha perdido

La primera gran estrella es el SMS que tiene una serie de características clave en toda esta aventura. Está siempre activo, interrumpe (o dicho en positivo, notifica) y tiene un sistema de pagos incorporado que lo hacen ideal para montar servicios. Las teleco lo explotan y lo explotan mal, como casi siempre: el horóscopo, la bolsa, los resultados de fútbol. Caros y casi nunca bien ejecutados, vacunan a una generación contra los bots y los servicios asociados.

Luego vendrían los ya conocidos, Whatsapp, Line, Telegram, WeChat (el gran ejemplo a seguir, hablaremos de él), Skype, Facebook Messenger, Kik … Al dejar de depender de la teleco pierden el siempre activo del SMS pero ganan en precio y en posibilidades. La conversación ahora es multimedia.

Todo lo que anima a pensar a que esta vez será diferente, los bots dominarán la tierra

Con lo que hemos comentado hasta ahora, lo de los bots suena a plato recalentado, a reciclaje de conceptos y productos ya gastados a los que se quiere volver a sacar a pasear. ¿Por qué hay tantas voces y empresas apostando a que todo esto será diferente, por qué tanto dinero se está moviendo a inversiones en esta categoría?

Aunque Nadella y Microsoft son los que lo han dicho más alto, quienes tienen el mérito de haber entrado primero son dos plataformas que apostaron en su momento por todo esto: Kik y WeChat.

El CEO de la primera tiene una columna a la que merece la pena dedicar su tiempo. En ella de hecho desprecia una de las grandes razones por las que se piensa que “ahora sí”: la mejora en la inteligencia artificial y, detrás de ella, la de los asistentes personales.

Los bots existen desde hace décadas, ¿qué ha cambiado ahora? La mejora en la inteligencia artificial y también en la tecnología de procesamiento del lenguaje natural

Hablamos, cómo no, de machine learning y de deep learning. En estos nuevos tiempos los bots no sólo serán capaces de ejecutar lo que se ha podido predefinir en el momento de su desarrollo sino que contarán con capacidad para ir aprendiendo, mejorando y adaptándose a cada usuario conforme se van alimentando de datos. De hecho, ese fue el gran problema de Tay, el bot fallido de Microsoft, que aprendió demasiado.

Otro punto a favor: la tecnología del procesamiento del lenguaje natural ha mejorado muy pero que muy mucho en la última década. Es quizás de uno de los desafíos computacionales más interesantes, “entender” peticiones expresadas con el lenguaje y por lo tanto con toda la complejidad y variación que podemos tener los seres humanos con él, y devolver una respuesta adecuada y personalizada.

Seguimos sumando, la chavalada prefiere el texto para muchos contextos y usos como la forma más cómoda de comunicarse. Véase el informe de Pew Research que recoge el muy buen artículo de The Verge sobre bots. De hecho lo venimos diciendo de hace tiempo, a corto y medio plazo, si va a apostar por un modo de comunicación, apueste por el texto.

En el argumentario a favor de que los bots van a sustituir a las apps se maneja también los problemas de estas. Por un lado hay una concentración muy fuerte en lo que utilizan los usuarios, que no parecen estar dispuestos a descargar, aprender cómo se usan y utilizar cientos de ellas.

Este aspecto es clave para entender el optimismo respecto a bots, el de la reducción de fricción. Frente al ir a una web o buscar en la web o el modelo de las apps de móviles, el interfaz de texto reduce mucho la fricción: no se instala nada nuevo, no se tiene que aprender cómo funciona cada una diferente, el resultado es la acción ejecutada, no un enlace a una web a leer y procesar. Todo esto en el supuesto de que funcionen tan bien como se plantea a priori, claro.

Los bots reducen la fricción: en lugar de tener que ir a una web y buscar allí o descargar una app para móviles y aprender a usarla

A eso hay que sumar que el coste de desarrollo y mantenimiento de las mismas es muy alto, por lo que el traspaso a bots conversacionales resulta tentador: ahora en lugar de la app para iOs y Android (y, vale, algunos para Windows Phone) de tu cadena de restaurantes ¿qué tal un bot al que se le pueda pedir la comida a través de un mensaje de texto?

Por último, tenemos la apuesta de los servicios de mensajería instantánea existentes y de la gente de Microsoft. Para el gran público tenemos a Kik, Telegram y WeChat ofreciendo APIs para que programemos bots en sus redes (a buen seguro que Facebook presentará esto para Messenger en su próxima conferencia para desarrolladores, jugando la doble carta de servicio simple con Whatsapp y sistema a lo WeChat con FM); para el entorno de empresa tenemos a Slack (que promueve la creación con su propio fondo de inversión), y Skype. Ahora Microsoft redobla la apuesta y facilita las cosas: si lo que te impide para hacer un bot es que no tienes tecnología de machine learning y procesamiento del lenguaje natural, te alquilan la suya.

Están los usuarios abrazando de forma masiva los servicios de chat, están las plataformas deseosas, la tecnología parece estar preparada y casi todas las compañías, argumentarios sólidos a favor de voces autorizadas como las de Messina o Gonzalo Martín e inversores corriendo para no quedarse fuera ¿cómo no va a funcionar?

Todo lo que anima a pensar de que con los bots lo que hay es sobredosis de hype

El SMS es la primera gran piedra de toque para lo que debatimos hoy y ejemplifica el primer y gran problema para esa idea de los bots como nuevas apps y la conversación como el interfaz y la plataforma: el problema de la línea de comandos.

La superación de la línea de comandos por el interfaz gráfico y las metáforas en las que se sostenía supuso un salto histórico en la experiencia de usuario. Mucho más intuitivo, salvaba esa descomunal curva de aprendizaje derivada del tener que aprender qué comandos servían y cómo se utilizaban en el sistema operativo.

Con los servicios basados en SMS quedaba desnuda la dificultad de plantear servicios complejos que interaccionaran con humanos en entornos conversacionales: cada vez tienen que explicarte qué opciones puedes utilizar.

Siri y Cortana son dos ejemplos de lo que todavía tenemos que avanzar en el procesamiento del lenguaje natural

¿Con la mejora del procesamiento del lenguaje natural se va a paliar esta dificultad? La respuesta la tenemos en la experiencia que ofrecen los Siri o Cortana a día de hoy: a duras penas. Es por ello que los bots de esta generación comienzan con una ambición más comedida, centrados en una categoría y contexto: encargar la comida, gestionar la agenda, comprar camisetas… dominios con un vocabulario controlado. En mi opinión tienen la casi imposible misión de salvar un clásico de la experiencia de usuario: o funcionas bien siempre o no te usaré nunca.

Esto nos lleva a una variación ligera de los conceptos de bots con el texto como interfaz natural, de hecho veremos fuertes variaciones según las plataformas vayan permitiéndolo: ahí WeChat es el referente a seguir.

Hay otra dificultad a salvar, la fragmentación actual es enorme. ¿Para qué plataforma, cada una con su API incompatible y con diferentes posibilidades? Skype, Telegram, Facebook Messenger, Line, Slack… de repente lo que parecía más simple y barato que hacer apps, ya no lo parece tanto.

La fragmentación de plataformas para las que desarrollar bots es hoy en día enorme: Skype, Telegram, Facebook Messenger, Line, Slack y un largo etc.

Sumemos razones para el escepticismo. ¿Conocen un ejemplo de bot con millones de usuarios de hace unos años? Yo sí, Clippy, el asistente de Microsoft. Quienes lo sufrimos no olvidamos como interrumpía, que pesado era, como tapaba lo que uno quería hacer y que poco ayudaba. En esta carrera de los bots capaces de aparecer además en las notificaciones del móvil uno de los grandes peligros es que un espacio ya saturado va a tener invitados automáticos que pueden hacernos añorar al asistente del Office.

Cerrando el círculo, ¿Cuántos ejemplos de bots de gran éxito, con un número descomunal de usuarios y un altos ingresos tenemos sobre la mesa? Pues… me atrevería a decir que cero. Con el que más “rozo” es con el slackbot de Slack y tengo anotadas las grandes inversiones y expectativas con Operator, Lark, Luka, Digit, Penny, Assist, Fin, Howdy… todos prometedores pero sin números reales que mostrar.

Lo que nos espera en 2016

Muchas noticias y muchos movimientos. Facebook estará aquí en el mes de abril con su Messenger y su Facebook M, Google también se apuntará, ¿Apple? Hay quien dice que puede estar dejando pasar un tren muy valioso…

Con la gran cantidad de dinero moviéndose hacia los bots tendremos una explosión similar, si no mayor, a las de las aplicaciones para smartphones. De hecho hasta los medios están con muchos planes alrededor de la idea de las conversaciones de texto y las automatizaciones. Ahí el mejor ejemplo es el de Quartz News

¿Cómo serán estos bots? Aquí nos toca especular un poco. Tenemos un modelo en el que los bots añaden información a conversaciones humanos a humanos (estamos en Slack hablando de una reunión y el bot detecta eso y nos propone una cita tras consultar nuestros calendarios); otro en el que quien interviene es el asistente, que es el planteamiento que más ha mostrado Microsoft en esta Build (preguntamos a Cortana y esta en vez de consultar a una web se apoya en bots para realizar acciones); y está el modelo en el que interactuamos directamente conversando con el bot (y en este último a veces está el apoyo de un ser humano para las tareas más complejas, es el caso de Operator en comercio electrónico).

En este último terreno hay un caso de uso que se perfila como bastante interesante, el del uso de bots para interactuar con elementos del mundo real. El ejemplo típico es llegar a un restaurante con mucha cola o antes de ir para recoger la comida, en lugar de usar una app, encargar mediante un bot que podemos encontrar a través de un código QR. Es el tipo de funcionamiento por el que están apostando Kik y WeChat.

Jobot es un bot de WeChat que te ayuda a buscar trabajo

Si los bots triunfan hay varios actores bien colocados y otros en una situación de riesgo a anotar. Facebook, Kik, Slack, Twitter… los dueños de las plataformas están en una situación de poder a priori, los bots funcionarán sobre ellas; Google tiene un riesgo palpable, si los bots empiezan a resolvernos tareas y dudas, buscaremos menos. Por otro lado, son pocos los que pueden poner sobre la mesa tecnología de lenguaje natural e inteligencia artificial, por lo que la aparente baja barrera de entrada no lo va a ser tal.

Google tiene un riesgo palpable, si los bots empiezan a resolvernos tareas y dudas, buscaremos menos

A la par irán surgiendo dudas y debates de fondo sobre estos bots. Por un lado el de los modelos de negocio (aunque esto parece que se está clarificando pronto, pago por suscripción en empresa, gratis con publicidad o cobrar por conversión de compra en consumo), por otro la responsabilidad ética (bots que automatizan la propaganda, que se refugian en el anonimato) y legal (bots que hacen declaraciones racistas, otros que compran drogas en la deep web) de artefactos que tienen un funcionamiento semiautónomo. Alrededor de esos y otros debates merece la pena leer el primer manifiesto sobre bots en MotherBoard.

Hay quien dice que los bots son las nuevas apps, también que para qué querremos web y que los bots acabarán (otra vez) con ella. En la Build hemos oído desde que todo desarrollador hará un bot hasta que todos los negocios tendrán uno. Es la fiebre del oro, esa sensación de que hay que subirse ahora o se perderá el tren. Como analista uno puede sentarse y darle un año para acabar de creerse de que estamos ante la “next big thing” pero las empresas y desarrolladores ya saben por otras tendencias que, si lo acaba siendo, llegar un año tarde puede ser letal.

En Xataka | Si un robot o un bot software comete un delito, ¿qué dice la ley sobre sus dueños?

Ver todos los comentarios en https://www.xataka.com

VER 44 Comentarios

Portada de Xataka