Los asistentes de voz que integran nuestros dispositivos móviles y que poco a poco van dando el salto a otras plataformas -Cortana ya forma parte de Windows 10- dan opciones muy interesantes a los usuarios, pero aún así muchos se quejan de que la precisión en el reconocimiento de voz sigue siendo aún muy baja.
En Microsoft, no obstante, creen que están cerca de lograr un reconocimiento de voz perfecto. Xuedong Huang, máximo responsable de las tecnologías de reconocimiento de voz en Redmond, afirma que "en los próximos cuatro o cinco años, los ordenadores serán tan buenos como los seres humanos" a la hora de entender las palabras que salen de nuestra boca.
Fundamental para el desarrollo de la inteligencia artificial
Microsoft lleva investigando este tema desde hace décadas, y como explicaba Huang, que ya trabajó en esta tecnología con Windows 95, en aquel momento la tasa de error era "casi del 100%". Sin embargo la evolución ha sido impresionante, y según Huang estos avances podrían ser la antesala de una nueva era: la de la construcción de una inteligencia artificial real.

"Entender una palabra es más fácil que entender el contexto", explicaba Huang, pero para él herramientas como Cortana están poco a poco logrando entender no sólo lo que decimos, pero lo que queremos decir. Eso implicaría poder tener conversaciones más complejas con nuestros dispositivos.
Para él este es el comienzo de una "revolución invisible". Huang está muy implicado con el Proyecto Oxford, las herramientas de aprendizaje automático para el reconocimiento de imágenes (¿recordáis el experimento de How-Old.net?) y de voz. En Microsoft creen que en los próximos años lograremos que esa capacidad nos permita una forma mucho más potente de comunicarnos con estos sistemas y de comenzar a plantear soluciones sólidas en el terreno de la inteligencia artificial.
Vía | BusinessInsider
Más información | Microsoft
En Xataka | Asistentes de voz y la lucha por la conquista de nuestra confianza
Ver 13 comentarios
13 comentarios
elbostwinsen
Que se ponga a hablar un gaditano... Va a entenderle un ordenador, seguro.
dago.pa1
Esperemos que para entonces ya tengan fecha de lanzamiento de cortana para Latinoamérica
Usuario desactivado
Un tanto optimista, me temo. Aunque ojalá sea una realidad. Y es que, una cosa en reconocer el habla de una persona que sabe que está hablando con una máquina -dicción clara, completar las frases, evitar jerga- y otra muy distinta ser capaz de reconocer una conversación coloquial... ¡Pero si ni yo soy capaz de entender -ni saber en qué idioma hablan- a según que compatriotas! :)
Chris Rock
No se si seré demasiado paranoico pero estas notas me hacen pensar más en los usos de espionaje masivo de la NSA que en productos de consumo.
lord.firefax
Qué bien, así nos contestará la voz de Scarlett Johanson hasta para pedir una pizza y los nerds podrán tener sexo fonético con su OS como en Her! :p