A Meta está ampliando seu leque de ferramentas de inteligência artificial com o lançamento do SeamlessM4T, um modelo de linguagem com a capacidade de transcrever discursos e traduzir falas em quase cem idiomas.
Este projeto está disponível para pesquisadores, seguindo a tendência dos recentes lançamentos de serviços inteligentes da empresa liderada por Mark Zuckerberg.
Leia também: Startup Nomad recebe aporte de R$ 300 milhões de empresa que investiu em Nubank e no ChatGPT
De acordo com a gigante da tecnologia, o lançamento deste novo modelo representa uma “mudança significativa” no campo da inteligência artificial voltada para a conversão de fala em texto e tradução de discursos. Esta iniciativa representa uma abordagem inovadora da empresa no sentido de criar uma ferramenta capaz de conectar dialetos de todo o mundo em um único serviço.
O que distingue esta inteligência artificial de outras propostas é a sua capacidade de executar diversos processos de tradução e transcrição – texto para texto, fala para fala, fala para texto e reconhecimento de fala – tudo em um único sistema. Além disso, o modelo consegue identificar quando uma pessoa está alternando entre dois ou mais idiomas na mesma frase.
![O SeamlessM4T poderá ser usado por desenvolvedores e pesquisadores, em diferentes soluções.](https://i0.wp.com/tagnoticias.com.br/wp-content/uploads/2023/08/22132711102224.jpg?resize=700%2C394&ssl=1)
Quando uma frase é pronunciada, a inteligência artificial a identifica automaticamente e a traduz para o dialeto de preferência utilizando uma voz sintetizada.
O SeamlessM4T, cujo nome significa “Tradução Automática Multilíngue e Multimodal Contínua em Grande Escala”, é considerado um “sucessor” do Universal Speech Translator, um dos poucos modelos de tradução de fala que suporta o idioma hokkien, falado em todo o Sudeste Asiático.
Esta nova tecnologia é fundamentada no Massively Multilingual Speech da Meta, um sistema que oferece reconhecimento de fala, detecção de idioma e síntese de voz em mais de 1.100 idiomas. Quando se trata de tradução de fala para fala e de texto para fala, o SeamlessM4T reconhece cem idiomas de entrada e os converte em 35 idiomas de saída.