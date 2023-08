A Meta está diversificando seu rol de soluções em inteligência artificial por meio do lançamento do SeamlessM4T. Este é um modelo de processamento de linguagem que tem a habilidade de transcrever discursos e traduzir o conteúdo falado em quase cem línguas distintas. A iniciativa é de acesso livre para estudiosos, seguindo o mesmo padrão dos mais recentes produtos inteligentes criados pela empresa de Mark Zuckerberg.

A gigante tecnológica declara que o surgimento desse novo modelo simboliza uma “transformação de grande impacto” no âmbito da inteligência artificial. E diz-se isso ainda mais nas versões voltada para a conversão de fala em texto e a tradução de discursos. Essa é uma representação com abordagem inédita por parte da empresa. A intenção certamente é construir uma ferramenta capaz de reunir variedades linguísticas de todas as partes do globo em um único serviço.

Diferencial dessa nova inteligência artificial da Meta

O diferencial que sobressai nesta inteligência artificial em comparação a outras proposições é sua aptidão para executar múltiplos procedimentos de tradução e transcrição — texto a texto, fala a fala, fala a texto e identificação de fala — dentro de um único sistema. Além disso, o algoritmo tem a capacidade de reconhecer quando uma pessoa utiliza dois ou mais idiomas em uma mesma frase.

O SeamlessM4T — ou Tradução Automática Multilíngue e Multimodal Contínua (“Seamless Massively Multilingual and Multimodal Machine Translation”, em inglês) — é considerado um “sucessor” do Universal Speech Translator. Esse é um dos raros modelos de conversão de fala para texto que oferece suporte à língua hokkien, falada em toda a região do Sudeste Asiático.

Essa inovadora tecnologia é embasada na plataforma Massively Multilingual Speech da Meta. O sistema viabiliza a identificação de fala, detecção de idioma e síntese vocal em mais de 1.100 línguas diferentes. Para procedimentos de conversão de fala para fala e de texto para fala, o SeamlessM4T consegue identificar cem línguas de origem e as transforma em 35 línguas distintas de destino.

Paralelamente à divulgação do SeamlessM4T, a companhia também liberou metadados relativos ao seu conjunto de dados de tradução aberto denominado “SeamlessAlign”. Este compreende mais de 270 mil horas de alinhamento entre fala e texto. O algoritmo de inteligência artificial já está acessível para a comunidade de pesquisadores e desenvolvedores.

Moderação do conteúdo nos mais diversos idiomas

A Meta enxerga que essa tecnologia possui uma potencialidade considerável na área de moderação de conteúdo em suas plataformas de mídia social. Quando se trata dos dialetos menos comuns, a empresa pode direcionar menos recursos humanos para a supervisão na plataforma — muitas vezes, essa incumbência é automatizada. Entretanto, essa abordagem pode abrir brechas para a disseminação desinibida de discursos inadequados. O SeamlessM4T, inserido nesse contexto, demonstraria uma eficácia maior na identificação de expressões ofensivas em todas as línguas.



A companhia afirma ter desenvolvido um sistema com a capacidade de reconhecer termos sensíveis. Na visão da empresa, “palavras tóxicas” são situações em que a tradução pode potencialmente “instigar ódio, violência, linguagem vulgar ou abuso”. O propósito dessa tecnologia é rastrear o surgimento de discursos inadequados por meio da análise da tradução resultante de uma postagem, como exemplo, no Facebook.

Desta forma, o sistema se apresenta como uma ferramenta fundamental na contenção da propagação de conteúdo prejudicial. Ademais, contribuirá também na promoção de um ambiente online mais seguro e respeitoso para todos os usuários, independentemente do idioma que utilizam.

Detecção do gênero

O SeamlessM4T também possui a capacidade de discernir variações de gênero, de acordo com a Meta. O modelo de inteligência artificial é capaz de quantificar essas diferenças nas traduções, por exemplo, identificando casos em que uma frase inclui uma forma de gênero para uma palavra, como “médico” ou “médica”, na língua portuguesa.

Ao detectar essas nuances linguísticas, o modelo pode introduzir um pronome feminino em uma língua de destino. É onde a gramática não contemplará uma variação de gênero correspondente e manterá um substantivo na forma masculina, se necessário.

Essa inteligência artificial apresenta um desempenho particularmente eficaz em tarefas relacionadas a idiomas. A Meta, empresa por trás do Facebook, Instagram e WhatsApp, reconhece essa característica e, portanto, lançou recentemente o modelo SeamlessM4T, capaz de traduzir e transcrever quase 100 línguas.

Atuação da inteligência artificial

O SeamlessM4T atua tanto no âmbito do texto quanto da linguagem, oferecendo diversas possibilidades:

Tradução de fala para texto para quase 100 idiomas de entrada e saída;

Tradução de fala para fala para quase 100 idiomas de entrada e 36 de saída;

Reconhecimento de fala para quase 100 idiomas;

Tradução de texto para texto para quase 100 idiomas;

Tradução de texto para fala para quase 100 idiomas de entrada e 35 de saída.

Para conceber esse modelo, a Meta afirma ter coletado bilhões de frases escritas e quatro milhões de horas de fala disponíveis publicamente na internet.