Microsoft demuestra un traductor universal de inglés a chino que mantiene su voz y acento

Un traductor universal de Star Trek

En un evento en China, el jefe de investigación de Microsoft, Rick Rashid, demostró un motor de traducción de voz a voz del inglés al mandarín en tiempo real. No solo la traducción es muy precisa, sino que el software también conserva el acento y la entonación del usuario. Aquí no solo estamos hablando de un traductor robótico digitalizado, esto está firmemente dentro del ámbito de Médico que o Star Trek traducción universal.

La mejor manera de apreciar esta tecnología es ver el video a continuación. Los primeros seis minutos más o menos es Rick Rashid explicando la dificultad fundamental de la traducción por computadora, y luego los últimos minutos demuestran realmente el motor de traducción de voz a voz del inglés al mandarín del software. Lamentablemente, no hablo chino, por lo que no puedo dar fe de la veracidad de la traducción, pero el público, unos 2.000 estudiantes chinos, parece bastante impresionado. Un intérprete profesional de inglés / chino también me comentó que la traducción por computadora es sorprendentemente buena; no está a la altura de la traducción humana, pero se acerca.



Hay, por supuesto, mucha magia tecnológica ocurriendo detrás de escena. Para empezar, es necesario entrenar el software, tanto con unas pocas horas de chino nativo hablado como con una hora del inglés hablado de Rick Rashid. A partir de esto, el software esencialmente divide su habla en los componentes más pequeños (fonemas) y luego los mezcla con el equivalente chino, creando un gran mapa de sonidos del inglés al mandarín. Luego, durante la presentación real en el escenario, el software convierte su discurso en texto (como puede ver en la pantalla de la izquierda), su texto en texto en mandarín (pantalla de la derecha), y luego el mash-up de Rashid / chino creado durante la capacitación. El proceso se utiliza para convertir ese texto en palabras habladas.

El resultado final definitivamente tiene un fuerte toque de Microsoft Sam digitalizado y robótico, pero es sorprendente la cantidad de acento, timbre y entonación de Rashid que se conserva.

En términos de precisión, Microsoft dice que el sistema completo tiene una tasa de error de aproximadamente una palabra de cada ocho, una mejora del 30% con respecto al mejor anterior de una palabra de cada cinco. Una mejora tan espectacular fue posible mediante el uso de Redes neuronales profundas, una técnica de aprendizaje automático ideada por Geoffrey Hinton de la Universidad de Toronto. Una red neuronal profunda es básicamente una red neuronal artificial (software que modela miles de 'neuronas' interconectadas), pero con algunos ajustes para que imite más de cerca el comportamiento del cerebro humano.

En el futuro, la gran pregunta es cuándo el software de traducción de voz a voz de Microsoft Research realmente llegará al mercado; y sí, en caso de que se lo pregunte, el software no se limita solo al inglés y al chino; Se pueden utilizar los 26 idiomas admitidos por Microsoft Speech Platform, incluido el mandarín a inglés. El caso de uso más obvio sería en su teléfono inteligente Windows Phone 8 (¿o 9?), O Skype: podría llamar a una empresa en China, Alemania o Brasil, hablar normalmente en inglés y escucharían su voz en su idioma local. . También puede utilizar su teléfono inteligente como traductor universal mientras viaja. Como puede ver a continuación, Microsoft estuvo jugando con la traducción de teléfono a teléfono en tiempo real en 2010:

Es de suponer que Microsoft está trabajando en tales aplicaciones, pero probablemente se esté frenando por consideraciones prácticas, como la potencia de procesamiento necesaria para realizar la traducción de voz a voz, o proporcionar una interfaz fácil de usar para el proceso de capacitación / aprendizaje. El proceso de formación en sí mismo podría requerir más potencia de procesamiento de la que un usuario doméstico puede proporcionar. ¡Pero siempre está la nube!

Copyright © Todos Los Derechos Reservados | 2007es.com