Desde ayer, personalidades de la política, la academia y la sociedad civil de toda la Hispanidad se reúnen en la ciudad argentina de Córdoba con ocasión del VIII Congreso de la Lengua. Y uno de los temas novedosos que han puesto sobre la mesa los ponentes de la jornada inaugural ha sido la relación del español con la inteligencia artificial.
Rebeca Grynspan, al frente de la Secretaría General Iberoamericana, ya apuntó en esa dirección al señalar que "la tarea no es ser parte del mundo digital [porque] eso ya lo estamos haciendo", sino "ser más decisivos, no contentarnos con que nos escriban el futuro: tenemos que escribirlo nosotros también".
Poco después Santiago Muñoz Machado, director de la Real Academia Española, hacía referencia explícita a la IA:
"Hoy no solo contamos con el español que están hablando más de 570 millones de personas [...] actualmente hablan español más millones de máquinas que de hombres".
"[Máquinas] capaces de crear variables semánticas. Hoy en día las máquinas y robots hablan el idioma que imponen sus creadores: las grandes corporaciones. La lengua de la inteligencia artificial tiende a diversificarse y hay que tomar medidas".
La RAE y la Asociación de Academias de la Lengua Española (ASALE) nos encontramos en momento parecido a lo que ocurrió en el siglo XVIII, hubo que unificar y organizar esa lengua. Nuestro reto ahora es normatizar, unificar y regularizar el español de las máquinas para que nos sigamos entendiendo, no solo entre humanos, sino también con los robots".
El mensaje que dejaban entrever las intervenciones era claro: si la Hispanidad no se preocupa del 'español de las máquinas', será Silicon Valley quien asuma ese papel, y eso afectará al español en su conjunto.
Muñoz Machado anunciaba también en su intervención que la RAE ha establecido "un acuerdo de investigación y colaboración sobre la lengua de la inteligencia artificial" con Telefónica -aunque abierto "a otras grandes empresas tecnológicas y medios de comunicación"-.
Pero fue precisamente el presidente de Telefónica, José María Álvarez-Pallete, quien mayor atención dedicó en su discurso a la temática de la inteligencia artificial.
Álvarez-Pallete afirmó que "la lengua española tiene un reto tremendo por delante", que pasa por "entender cómo se está fraguando la lengua sintética con la que ya nos relacionamos" cuando interactuamos con nuestros asistentes de voz, solicitándoles noticias, resultados deportivos o traducciones.
"Urge hacerlo desarrollando inteligencia artificial basada en nuestra lengua", ha afirmado, poniendo como ejemplo a Aura, desarrollada por la propia Telefónica.
Álvarez-Pallete ha recordado que "cuanto menos precisos, más erróneos o menos relevantes sean [los datos con los que aprende a hablar una IA], más errores, limitaciones o incluso sesgos se incorporarán en el lenguaje sintético. Esto supone una amenaza para el futuro de nuestra lengua que no podemos ignorar si queremos asegurar el uso del español por futuras generaciones".
Ha aportado datos en este sentido, demostrando que los errores del lenguaje se extienden a gran velocidad y avisando de que la inteligencia artificial está aprendiendo de ellos.
Así, por ejemplo, palabras como 'cocreta' aparecen en casi ochenta mil referencias de búsquedas; el uso erróneo del imperativo del verbo decir, 'decirlo', 'arroja más de dos millones de resultados... mientras que su forma correcta, 'decidlo', muestra tan sólo algo más de tres mil. Por descontado, los vocablos de uso menos habitual "desaparecen o arrojan resultados residuales".
El presidente de Telefónica también se ha acordado de "los procesadores de texto más comunes" y su impacto sobre la configuración del nuevo lenguaje sintético", subrayando que muchos de estos procesadores "fallan al reconocer palabras correcta [...] de las 93.000 palabras del diccionario, Word señala como incorrectas 7.500". Y, además, cuando esto sucede, "proponen corregirlas y sustituirlas, dando lugar así a un empobrecimiento y adelgazamiento del léxico".
"Este es el momento de abordarlo, ya que en los próximos años cientos de millones de máquinas hablarán español. La lengua sintética aprende y tenemos herramientas, conocimiento y expertos para enseñarla como es debido".
También intervino Chema Alonso, jefe de datos de Telefónica, realizando una curiosa reflexión:
"Dado el crecimiento vertiginoso de los programas de reconocimiento de voz, en el futuro podríamos tener niños con acento Alexa o con acento Siri".
Ver todos los comentarios en https://www.xataka.com
VER 33 Comentarios