Ainda em fase inicial de testes, software usa fragmentos da voz do usuário para “montar” palavras

A Microsoft apresentou na última semana, durante o evento TechFest 2012, que expõe novas tecnologias desenvolvidas pela empresa, um tradutor simultâneo de voz. O protótipo chamado Monolingual TTS, pode traduzir simultaneamente 26 idiomas diferentes.

Para funcionar, o sistema precisa inicialmente de uma hora de áudio com a voz do usuário, em seu idioma nativo. Esse áudio é então dividido em “pedaços” minúsculos, de 5 milissegundos de duração. Os pedaços de áudio são então recombinados para formar palavras em novos idiomas.

Na demonstração do TechFest, o software construiu frases em chinês e espanhol com a voz do executivo da Microsoft Craig Mundie, que fala apenas inglês. A demonstração pode ser vista aqui (a partir dos 12 minutos de vídeo)

Sistemas que traduzem texto para voz não são novidade. A inovação do software da Microsoft é que a voz usada na tradução é a do próprio usuário, e não uma voz digitalizada já presente no computador. O sistema abre caminho para a tradução universal em tempo real, que permitiria que pessoas conversassem em tempo real usando idiomas diferentes.

    Faça seus comentários sobre esta matéria mais abaixo.