Translatotron: o Google está desenvolvendo uma máquina de fala para fala

Interpretar e traduzir a fala ao vivo é muito mais difícil do que simplesmente traduzir o texto escrito. Ao contrário do cérebro humano, as máquinas geralmente precisam passar por três fases separadas para converter a comunicação oral de um idioma para outro.

Inicialmente, o discurso deve ser interpretado pela máquina e transcrito em texto, que será traduzido para o dialeto selecionado, antes de entrar em uma máquina de texto para fala que o converterá e pronunciará.

Agora, o Google está trabalhando de uma maneira mais natural de falar do que um discurso chamado Translatotron, que não requer processamento intermediário para tradução. A interpretação do discurso ao vivo não é novidade, pois o Google o apóia no aplicativo Translate desde 2011 e recentemente ficou disponível para o Assistant.

No entanto, o Translatotron fornece interpretação imediata de fala para fala, elimina intermediários, trabalha mais rápido, reduz erros que podem ocorrer durante a conversão e pode ignorar até palavras que não precisam ser traduzidas.

Também é impressionante que o Translatotron possa manter a voz do falante original no idioma traduzido, tornando o discurso mais natural.

Na realidade, no entanto, esse experimento ainda está em desenvolvimento. Por exemplo, os resultados atuais ainda são mais lentos que a conversão em cascata e alguns resultados são incompreensíveis.

Além disso, embora o Translatotron possa imitar a voz do alto-falante original, parece muito robótico, antinatural e lento. Mas não vamos esquecer que a tradução direta de fala para fala está em um estágio inicial, portanto o futuro é muito promissor.

Fonte