Alunos de engenharia da Universidade Stanford, nos EUA, desenvolveram um programa de computador que “traduz” o sotaque de uma pessoa em tempo real. Esse tradutor de acento linguístico pode ser integrado a aplicativos como Zoom e WhatsApp ou usado em chamadas telefônicas.
Essa primeira versão do aplicativo faz com que duas pessoas que falam inglês possam se entender mutuamente, independente se usam o idioma com suas próprias pronúncias ou palavras exclusivas de cada região. A ideia é reduzir as barreiras de comunicação entre falantes da mesma língua por conta da falta de compreensão dos diversos tipos de sotaque.
“Sabíamos por vivência própria que forçar um sotaque diferente em você mesmo é desconfortável. Eu fui para uma escola secundária britânica e tentei forçar um sotaque britânico, o que se tornou uma experiência improdutiva, desgastante e difícil de digerir”, lembra o estudante de engenharia Andres Perez Soderi, um dos criadores do aplicativo.
Tradutor de sotaque
Em vez de tentar mudar a forma como as pessoas falam, os estudantes resolveram treinar um algoritmo para traduzir as variações de diferentes sotaques. Eles alimentaram o sistema com centenas de gravações com palavras e frases pronunciadas de maneiras distintas por nativos de várias regiões.
O tradutor de sotaque foi treinado para compreender cinco variações idiomáticas de falantes norte-americanos, britânicos, australianos, filipinos e espanhóis. Ele tem um atraso de 150 milissegundos (cerca de um sexto de segundo), sendo que essa demora na resposta também depende da ferramenta usada na comunicação.
“O Zoom, por exemplo, tem uma média de atraso de 50 milissegundos, então alguém usando o tradutor de sotaque com esse serviço experimentaria um atraso total de 200 milissegundos. No entanto, qualquer coisa abaixo de 300 milissegundos é quase imperceptível para quem está ouvindo”, explica Soderi.
Sanas
Os alunos de Stanford criaram uma startup chamada Sanas para dar seguimento ao projeto que pretende aumentar a eficácia da comunicação em conversas digitais. Em apenas um ano de existência, eles já conseguiram um financiamento de US$ 5 milhões (cerca de R$ 28 milhões na cotação atual) para aprimorar a tecnologia.
A ideia é expandir o uso do tradutor de sotaque para outros idiomas, como o espanhol falado em países diferentes, além de aperfeiçoar a rede neural para que ela possa aprender a mapear as variações dos sotaques durante a pronúncia de palavras semelhantes automaticamente, o que facilitaria a implantação em diversas áreas da comunicação.
“Esse tradutor pode ser uma bênção para muitas empresas, especialmente aquelas que fornecem atendimento ao cliente e suporte técnico por telefone. Existe também a possibilidade de usos criativos, como aqueles em entretenimento e mídia, em que os produtores podem tornar seus filmes e séries compreensíveis em diferentes partes do mundo, independente do sotaque”, encerra o CEO da Sanas, Maxim Serebryakov.
Fonte: Leee Spectrum e Canaltech