Una IA de Facebook es capaz de traducir entre 100 idiomas distintos y sin tener que pasar por el inglés

Poco a poco la traducción entre diferentes idiomas es más acertada por parte de los ordenadores con interesantes opciones como Google Translate o DeepL. Esto ya no es tanto por el significado literal de cada palabra sino por el contexto en el que se encuentran las oraciones y fragmentos de texto a traducir. Facebook busca colaborar en este ámbito también y para ello ha desarrollado una inteligencia artificial que entiende 100 idiomas distintos. A diferencia de Google Translate u otros, no necesita pasos intermedios como traducir al inglés.

La inteligencia artificial llamada M2M-100 de Facebook puede traducir entre cualquier par de los 100 idiomas con los que ha sido entrenada. Por ahora su uso va a estar limitado a la investigación y el modelo de hecho pasa a ser de código abierto. En un futuro, si sigue mejorando, buscarán implementarlo en productos de Facebook.

Más directo para evitar la pérdida de contexto

A la hora de desarrollar este potente traductor Facebook decidió tomar un camino algo distinto al tradicional. Debido a la dificultad que supone entender el significado y contexto de tantos idiomas, normalmente se pasa por uno intermediario del que sea más fácil traducir, este suele ser el inglés. En este caso es diferente, la IA de Facebook traduce directo de un idioma a otro aunque ninguno de los dos sea el inglés. Dicen que así se puede perder menos significado en el proceso de traducción al ser más directo.

Google Translate u otros traductores normalmente primero traducen un texto al inglés si es algo más complejo. Por ejemplo si queremos traducir este artículo del español al vietnamita lo más probable es que el traductor primero lo traduzca al inglés y el resultado lo traduzca al vietnamita, enseñándole al usuario directamente el resultado final. ¿Por qué? Porque puede hacer asociaciones entre el inglés y el español y el inglés y el vietnamita más fácil que entre el español y el vietnamita.

Los investigadores de Facebook entrenaron a M2M-100 con un total de 7.500 millones de pares de oraciones extraídas a lo largo y ancho de Internet. Una herramienta externa identificó el idioma de cada oración y posteriormente las clasificó. A partir de ahí una herramienta de Facebook se puso a emparejar oraciones para hacer coincidirlas por su significado.

Para el emparejamiento el programa agrupaba idiomas que tenían más posibilidades de requerir una traducción entre ellos. Factores como la región geográfica, las similitudes lingüísticas o el valor histórico fueron decisivos. Por ejemplo tenía más sentido emparejar y buscar similitudes entre español y catalán que español y maorí, porque es mucho más probable que los usuarios quieran traducir entre catalán y español que entre español y maorí.

En principio este nuevo traductor de Facebook debería devolver resultados más rápidos y sobre todo más precisos en la traducción. Lo sabremos con el tiempo, si finalmente llega a productos finales para el consumidor.

Vía | VentureBeat
Más información | Facebook

Ver todos los comentarios en https://www.xataka.com

VER 5 Comentarios

Portada de Xataka