Que la inteligencia artificial (IA) promete dejar una huella de calado en las empresas es algo difícil de dudar hoy en día, incluso a pesar de la juventud de herramientas como Stable Diffusion, Midjourney V5 o GPT-4. No es cuestión de corazonadas o sospechas. Su impacto se está dejando sentir ya en ciertas empresas y oficios e incluso hay estudios, como el publicado en marzo por investigadores de OpenResearch, la Universidad de Pennsylvania y Open AI, padre de ChatGPT y DALL-AE, que reconocen que sus modelos pueden afectar a miles de empleos.
La gran incógnita es… ¿Qué escenarios se abren en la interacción entre los trabajadores y la IA? ¿Puede convertirse en una aliada, volvernos más eficientes? En el MIT ya han estudiado el asunto. Y sus conclusiones son reveladoras.
¿En qué consistió su estudio? Básicamente, en comprobar cómo afecta ChatGPT a nuestra productividad como trabajadores. Al menos la de un grupo de muestra que se dedica a elaborar documentos comerciales. Para lograrlo, Shakked Noy y Whitney Zhang, del MIT, reunieron a 444 profesionales con experiencia en diferentes labores, como vendedores, redactores, analistas y técnicos del área de Recursos Humanos. Luego pidieron a cada uno de ellos que redactara dos textos en sus respectivos campos, como informes, planes de análisis o notas de prensa, tareas similares a las que desempeñan para su empresa en el día a día.
El primer documento lo escribieron de forma rutinaria, con sus recursos habituales. La cosa empezó a ponerse interesante con el segundo: a la mitad le permitieron utilizar ChatGPT y los restantes 222 volvieron a trabajar de forma "normal", con sus recursos tradicionales y sin ningún tipo de asistencia de la inteligencia artificial. Con todo el material ya listo los documentos fueron evaluados por tres profesionales que les asignaron una nota entre 1 y 7. Al examinarlos, claro, no sabían cuáles se habían hecho con IA.
¿Y qué comprobaron? Que los empleados que habían tenido la ayuda de ChatGPT destacaban en dos puntos: rapidez y calidad. Al examinar los primeros documentos, todos elaborados sin apoyo de la IA, los resultados de los dos grupos de prueba fueron similares, pero la cosa cambió cuando 222 de los trabajadores pudieron echar mano del motor de OpenAI. En ese caso sí hubo diferencias.
Los empleados que habían manejado IA entregaron sus trabajos en 17 minutos, bastante por debajo de los 27 de los compañeros que no contaban con la ayuda de algoritmos. Si se traslada ese resultado a toda una jornada laboral, se traduce en que un profesional asistido por inteligencia artificial sería capaz de producir un total de 28,3 documentos frente a los 17,7 de otro privado de esa ayuda. La diferencia en términos de productividad es contundente: del 59%.
Pero… ¿Y la calidad del trabajo? En eso también destacaron. Más rapidez conlleva en ocasiones una merma en la calidad, pero esa premisa no se cumplió en la prueba del MIT. Cuando les tocó evaluar los documentos, trabajos cuyo origen desconocían, los examinadores asignaron un promedio de 4,5 a los que se habían realizado con ayuda de ChatGPT frente al 3,8 que recibieron los realizados sin IA. Si tenemos en cuenta que la escala iba del 1 al 7 la diferencia es sensible.
El dato es relevante por otra razón: la mayoría de los empleados que usaron ChatGPT no lo habían manejado antes, con lo que carecían de experiencia. Para ser más precisos, solo el 30% de los participantes lo habían utilizado con anterioridad. El matiz es bastante importante porque quienes manejaron ChatGPT no tuvieron una curva de aprendizaje previa, habitualmente un requisito fundamental para sacar todo el provecho que puede ofrecer una nueva herramienta.
¿Y cuál es la explicación? Como detalla Nielsen Norman Group, el uso de la herramienta reduce los desequilibrios de las habilidades. Quienes más se vieron beneficiados en la puntuación final fueron los trabajadores que habían obtenido una nota menor en la primera fase de la prueba y utilizaron la IA en la segunda. Otra de las claves es que el manejo de ChatGPT cambió la forma en que los empleados invertían su tiempo al desempeñar las tareas.
Sin el motor dedicaban un 25% al brainstorming, un 50% a la redacción del borrador y el 25% restante a su edición para lograr el resultado final. Cuando la IA entraba en la ecuación el lapso dedicado a crear los borradores se redujo a más de la mitad y el centrado en "pulirlo" se duplicó. ¿Qué significa eso? Un tiempo total menor y mayor atención en la fase final, centrada precisamente en perfeccionar el resultado. La inversión de minutos en el brainstorming también fue menor, aunque el recorte entra en el margen de error contemplado en el estudio.
¿Son relevantes los resultados? Sí, aunque como reconocen en Nielsen Norman Group, conviene manejarlos con cierta cautela. La razón: las limitaciones del estudio, centrado en un perfil profesional muy concreto y en una tarea también bastante específica. La redacción de cada documento sin ayuda de la IA exigió al fin y al cabo menos de media hora de los empleados. Las conclusiones del informe son significativas, pero dejan dudas botando, como el impacto de la IA en otras profesionales, diferentes categorías profesionales y tareas más extensas.
Imagen de portada: Emiliano Vittoriosi (Unsplash)
Ver todos los comentarios en https://www.xataka.com
VER 12 Comentarios