Me río yo de la torre de Babel. Lo de no hablar el mismo idioma que otras personas hace tiempo que dejó de ser una limitación importante para la comunicación: la tecnología nos ha traído servicios que ayudan a facilitar esa interacción hablada y escrita, y Microsoft ha abierto un nuevo capítulo en esos avances.
Se trata de Skype Translator, un servicio casi futurista que de momento permite traducir del inglés al español y viceversa en conversaciones de voz de tiempo real, pero que soporta más de 40 idiomas si usamos su cliente de mensajería instantánea. Nosotros hemos querido analizar si sería posible mantener una conversación coherente con este servicio simulando ese escenario, y el resultado ha sido sorprendente.
Mucho trabajo por detrás
Los propios ingenieros de Skype dejan claro que de momento el servicio está en una fase muy preliminar y que por tanto la eficiencia y precisión de los distintos mecanismos implicados es limitada. La traducción dista mucho de ser perfecta, sobre todo si hablamos normalmente y con frases hechas que parecen normales en el lenguaje coloquial pero que son especialmente difíciles de entender por estos motores.
Las tareas implicadas en dar ese servicio son muy complejas y muy variadas, y por ejemplo tenemos que el reconocimiento de voz, la traducción por parte de una máquina (a través del servicio Microsoft Translator), la síntesis de voz, el procesamiento en la nube y el aprendizaje automático se entremezclan en una tarea realmente intensiva que parece más del futuro que de la época actual.
Y precisamente por esa complejidad Skype Translator tiene ciertas limitaciones, como la de hablar con un ritmo sostenido pero no demasiado rápido, o la de no hacer frases demasiado largas. La puesta en marcha de la conversación con nuestro contacto es más lenta de lo normal, y puede llevar unos 30 segundos -el "traductor virtual" debe prepararse antes de cada llamada- pero a partir de ahí podremos disfrutar de una curiosa experiencia: la de que ese traductor vaya traduciendo automáticamente de un idioma a otro todo lo que van diciendo los dos interlocutores.
El servicio nos avisa, eso sí, de que nuestra conversación será grabada con el objeto de mejorar el reconocimiento: cada frase que decimos sirve para afinar el motor de reconocimiento de voz conforme a la pronunciación que tiene cada persona. En ningún momento -aseguran desde Microsoft- esos clips de audio están asociados a una identidad real, y los clips son anónimos y están destinados a mejorar la precisión del reconocimiento de voz.
Nuestras pruebas, o en inglés, our tests
Para probar el servicio pusimos en marcha una simulación de un escenario real, en el que yo hablaba en inglés y mi compañero Juan Carlos González lo hacía en español. Como veréis, el resultado fue dispar, pero sorprendía el buen comportamiento de Skype Translator en diversos momentos de la conversación.
De hecho, parte de los errores cometidos por el servicio de Microsoft se debieron más a esa simulación -mi inglés tiene también sus limitaciones, me temo- y al hecho de que no acabábamos de ajustar el ritmo o las pausas adecuadas. El uso del micrófono de nuestras webcams no ayudaba, y aquí Microsoft era clara en sus recomendaciones: es mucho más recomendable utilizar auriculares con micrófonos de cierta calidad para lograr un proceso más eficiente.
Las dificultades para Skype Translator se notaban especialmente en los nombres propios -al final, por ejemplo, digo "Juan Carlos" y él entiende "how sincere" y lo traduce como "cuán sincero")- pero también en algunos giros del lenguaje que obviamente tenía dificultad para reconocer y traducir adecuadamente.
Y sin embargo, el resultado fue más que aceptable. Aunque ambos entendíamos lo que el otro estaba diciendo sin necesidad de traductor, la conclusión es que es posible llegar a un entendimiento bastante alto entre personas que no hablen ambos idiomas. En los casos en los que el reconocimiento de voz no es perfecto, además, podremos hacer uso del cliente de chat, con el que la traducción es mucho más precisa ya que no está involucrada la faceta de reconocimiento de voz y además podemos construir frases de forma más ordenada y a menudo precisa para ese proceso de traducción rápida.
Más información | Skype Translator
Ver 44 comentarios