Microsoft anuncia un hito histórico: la tecnología que iguala al ser humano reconociendo el lenguaje natural

24 comentarios Facebook Twitter E-mail

18 Octubre 2016 Actualizado 19 Octubre 2016, 23:28

Éricka Duarte

El equipo de la división de Inteligencia Artificial e Investigación de Microsoft acaba de publicar un documento en el que asegura haber alcanzado un gran hito en el reconocimiento del habla conversacional. Según los investigadores, su sistema de reconocimiento de voz alcanzó una tasa de error del 5,9%, cifra que está a la par de las capacidades humanas. O, dicho de otro modo, actualmente existen máquinas que transcriben como nosotros.

La tasa de error reportada por los investigadores de Microsoft, es equivalente a la de una persona capaz de transcribir la misma conversación. Además, es la más baja registrada en los proyectos de reconocimiento de voz de toda industria.

¿Y eso en qué nos afecta? Más allá del logro en sí, este paso facilita enormemente que el ser humano pueda comunicarse y hasta conversar con los ordenadores, ofreciendo no solo nuevos niveles de interacción sino también posibilidades tanto para uso diario como para las personas con dificultades localizadas. Así mismo, este es un paso importante para Microsoft, pues ya estaría en la capacidad de desarrollar robustos asistentes personales para competir con Google Home o Alexa de Amazon.

Este nuevo logro llega apenas un mes después de que la compañía de Redmond reportara un récord mundial en este tipo de tareas, alcanzando una tasa de error del 6,3%.

El objetivo final de Microsoft

Aunque este nuevo logro alcanzado por la compañía ha sido catalogado como histórico, Engadget asegura que el equipo de Inteligencia Artificial de Microsoft está trabajando para obtener un funcionamiento óptimo de su sistema de transcripción en situaciones de la vida cotidiana, como cuando hay mucho ruido en el ambiente y el reconocimiento de voz se puede complicar.

De igual manera, la compañía estaría contemplando la posibilidad de transcribir discursos producidos por varias personas a la vez, lo que sería muy interesante, pues el ordenador podría reconocer lo que dicen grandes grupos de usuarios por separado.

Vía | Microsoft