Sistema também é capaz de identificar 4 mil línguas. Segundo a empresa, objetivo do projeto de código aberto é impulsionar o desenvolvimento de ferramentas de IA em mais idiomas e ajudar na preservação da diversidade linguística.
Com capacidade de reconhecer 4 mil idiomas falados e produzir textos em 1,1 mil línguas diferentes, a Meta apresentou nesta segunda-feira (22/05/2023) seu novo modelo de inteligência artificial voltado para a linguagem.
O projeto de código aberto, chamado Massively Multilingual Speech (MMS), tem o objetivo de ajudar pesquisadores a preservar a diversidade linguística e incentivar a criação de novas bases de IA, segundo a empresa, dona do Instagram, Facebook e WhatsApp.
“Estamos compartilhando publicamente nossos modelos e códigos para que outros na comunidade de pesquisa possam desenvolver trabalhos”, informou a Meta, em comunicado. “A partir deste projeto, esperamos dar uma pequena contribuição para preservar a incrível diversidade linguística do mundo.”
O Engadget lembra que modelos de reconhecimento de fala e conversão de texto geralmente exigem treinamento com milhares de horas de material de som, além de transcrições em texto. Um dos desafios nesse campo é o desenvolvimento de modelos de IA com idiomas que têm menos falantes no mundo. Nesses casos, “estes dados simplesmente não existem”, explica a Meta.
A expectativa da companhia é que o modelo de código aberto possa contribuir para o desenvolvimento de tecnologias assistivas em mais linguagens, incluindo ferramentas de realidade virtual e realidade aumentada.
Para a empresa, o modelo poderá ajudar na preservação de idiomas que correm o risco de, no futuro, desaparecerem. “Nós visualizamos um mundo onde a tecnologia tem o efeito oposto, encorajando as pessoas a manterem seus idiomas vivos, pois podem acessar informações e usar a tecnologia falando em seu idioma preferido”.
Treinamento com Bíblia
Para desenvolver o MMS, a empresa adotou um método pouco convencional: usou também gravações e traduções de textos religiosos, com a Bíblia. “Essas traduções têm gravações de áudio disponíveis publicamente de pessoas lendo esses textos em diferentes idiomas”, explicou a Meta.
A companhia, no entanto, nega que essa base de treinamento possa influenciar os vieses da IA. “Embora o conteúdo das gravações de áudio seja religioso, nossa análise mostra que isso não influencia o modelo a produzir uma linguagem mais religiosa”.
Via Época Negócios