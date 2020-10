Uma equipe de pesquisadores do Laboratório de Ciência da Computação e Inteligência Artificial do MIT (CSAIL) anunciou na última quarta-feira (21) a criação de um algoritmo de decifração capaz de fornecer automaticamente o significado de linguagens perdidas há muito tempo, mesmo que não tenham qualquer relação com outros idiomas.

O projeto se baseia em um artigo escrito no ano passado pela professora Regina Barsilay, do MIT, e do estudante de doutorado Jiaming Luo, do MIT , que decifrou duas línguas mortas: o ugarítico e o Linear B, que levaram muitos anos para serem decifradas pelos humanos. Porém, essas línguas estavam relacionadas às primeiras formas do hebraico e do grego.

Com o novo sistema, a relação entre línguas é inferida diretamente pelo algoritmo. Essa questão era um dos maiores desafios da decifração. No caso do Linear B, um silabário utilizado pela Civilização Micênica entre os séculos XV a.C. e XII a.C., foram necessárias décadas de estudo para que se chegasse à sua decifração.

Fonte: alagunasr/Adobe Stock/ReproduçãoFonte: alagunasr/Adobe Stock

Testando linguagens

Mas há línguas, como a ibérica, das quais não se conhece outras linguagens relacionadas, com alguns defendendo o basco, enquanto outros afirmam categoricamente que o ibérico não se relaciona com nenhum tipo de idioma conhecido.

Preparado para avaliar a proximidade entre duas línguas, o algoritmo foi testado no ibérico, comparando-o ao basco e a outros candidatos menos prováveis, como famílias românicas, germânicas, turcas e Uralic. Nenhuma das línguas foi considerada relacionada, nem mesmo o basco ou o latim.

Para chegar a essa conclusão, o algoritmo teve que categorizar palavras em um idioma antigo e vinculá-las a seus equivalentes em outros idiomas relacionados. Em outras palavras, o processo não consegue ser um Google Tradutor, traduzindo línguas “mortas” diretamente para o inglês, mas consegue identificar as raízes de diversas línguas antigas.

Para trabalhos futuros, a equipe pretende expandir a decifração para além do ato de conectar textos a palavras relacionadas a uma linguagem já conhecida. Uma nova abordagem envolveria identificar o significado semântico das palavras, mesmo sem saber lê-las.