Uno no se cansa de ver demos de GPT-3. Tras enseñarnos un generador donde solo teníamos que describir la web que queríamos y la IA nos daba el código HTML/CSS, ahora Sharif Shameem, fundador de Debuild, ha integrado el modelo de lenguaje GPT-3 dentro de Chrome y le ha pedido que "compre unos AirPods".
La propuesta es sencilla. La IA tiene acceso al navegador como lo podríamos tener nosotros. Es decir, tiene un cursor y se mueve por las distintas webs como lo haríamos nosotros con el ratón. Una demo muy sencilla que permite observar cómo entiende la IA internet, en qué elementos se detiene de las distintas páginas web y dónde se queda encallada.
Una política de privacidad impide a GPT-3 completar la tarea
Os anticipamos que lamentablemente GPT-3 todavía no es suficientemente avanzado como para poder comprar por sí mismo. Internet es suficiente complejo para liar a la IA y que esta se pierda.
Aquí os dejamos la demo de GPT-3, publicada en Twitter por el mismo autor.
I gave GPT-3 access to Chrome with the objective "please buy me Airpods".
— Sharif Shameem (@sharifshameem) June 17, 2021
Pretty interesting if you ask me 🤔 pic.twitter.com/zwHPLZOlUJ
El primer paso de la IA es, como haríamos la mayoría de nosotros, buscar en Google. Introduce la dirección. La IA también entiende dónde hay que escribir en la web de Google, en ese recuadro central. "Comprar AirPods" como palabra clave parece una buena estrategia para conseguirlos.
En vez de clickar en la primera opción de búsqueda, la IA opta por intentar encontrar "las mejores ofertas de AirPods que puedes comprar ahora mismo". En este sentido, el cursor se mueve hacia abajo dentro de Google y decide entrar en un artículo de TheVerge. (Una lástima que GPT-3 no apuesta por las ofertas de AirPods de Xataka Selección).
Una vez dentro del artículo, el cursor se mueve y GPT-3 es capaz de entender cuál es el enlace de compra dentro del artículo. En el caso concreto de la demo, ese enlace lleva a Walmart. Desconocemos qué criterio sigue la IA, pero seguramente ayude el hecho que Walmart sea una tienda reconocida.
Una vez en la página de producto de Walmart, antes de clickar en comprar, la IA se va a las condiciones y la política de privacidad. Es en este punto donde hay una gran complejidad, pues la IA podría haberse confundido con algún anuncio o haber comprado a través de un enlace incorrecto.
De alguna manera, GPT-3 intenta conocer qué tipo de proceso de compra va a realizarse y acaba entrando en una política de privacidad que le despista completamente de su cometido inicial. En esa página de privacidad no hay ningún elemento que la IA pueda relacionar con el cometido de comprar un AirPod y es cuando falla.
Un primer paso para crear asistentes que se muevan por la internet
El creador de la demo explica que se podría bifurcar la orden de compra en varios pasos, donde cada una de estas tareas generaría su propia interacción de la IA. Luego se podría programar para que se eligieran las mejores interacciones de cada una, una especie de "grupo de torneo". Las posibilidades de GPT-3 son enormes, pero aquí ya entra en acción la habilidad del programador para que las indicaciones sean más precisas.
La posibilidad que una IA haga acciones así con una orden tan sencilla abriría la puerta a miles de aplicaciones, pero por el momento GPT-3 está lejos de conseguirlo. Sí es fascinante ver en acción a GPT-3 en una tarea equivalente a la que podríamos hacer nosotros.
Por el momento, la demostración servirá para intentar atraer a ingenieros con conocimientos en React, para ayudar al autor a crear un prototipo de herramienta que aproveche GPT-3 para moverse solo por interfaces web. Las herramientas comerciales basadas en este modelo de lenguaje no deberían tardar en llegar. Y prometen un nivel de automatización mucho más grande del actual.
Ver 16 comentarios