Língua antiga com um milhão de textos são decifrados por IA

Línguas mortas são conhecidas por serem difíceis de decifrar. Demorou 23 anos para quebrar os hieróglifos egípcios na Pedra de Roseta. Os glifos maias levaram quase dois séculos para serem compreendidos. Além disso, a forma mais antiga do grego, Linear B, só foi descoberta há mais de 3.000 anos. No momento em que pensadores tecno-positivos discutem a capacidade de mudar o jogo da IA, eles se referem a questões problemáticas como essa e, de qualquer forma, para dialetos que já foram decifrados, os desafios permanecem. Pegue a escrita cuneiforme acadiana, que é uma das línguas escritas mais antigas do mundo. Uma ferramenta de inteligência artificial agora pode decodificar quase um milhão de textos acadianos em questão de segundos, porque há muito poucas pessoas que podem ler o idioma antigo.

Em maio, um grupo de pesquisadores de ciência da computação e história descreveu como eles desenvolveram um modelo de inteligência artificial que poderia traduzir instantaneamente os glifos antigos. O grupo, conduzido por um programador do Google e um assiriologista do Ariel College, preparou o modelo em interpretações cuneiformes existentes, utilizando a mesma inovação que alimenta o Google Decipher.

Sem uma riqueza de contexto cultural, traduzir línguas mortas, especialmente aquelas sem línguas descendentes, pode ser como viajar sem uma estrela do norte. Tal linguagem é acadiana. O acadiano era a língua falada e escrita do Império Acadiano, que existiu entre os séculos 24 e 22 aC no que hoje é o Iraque. Ele usava um alfabeto triangular com figuras nítidas e cruzadas para seu sistema de escrita cuneiforme. Cuneiforme se traduz literalmente como “em forma de cunha” em latim, e os acadianos normalmente escreviam marcando uma tabuleta de argila com a ponta em forma de cunha de uma palheta. Incontáveis esses tabletes, devido à resistência de seu material, resistiram a centenas de anos e atualmente povoam os saguões de diferentes faculdades e galerias.

Um equívoco comum sobre a tradução é que ela é uma descriptografia individual de uma palavra ou frase estrangeira. No entanto, devido a diferenças culturais e de construção, uma declaração em um idioma pode nem sempre ter um equivalente exato ou fácil em outro. Uma interpretação de alto nível requer uma informação profunda sobre os designs dos dois dialetos, suas sociedades abrangentes e as crônicas que ancoram essas sociedades. Quando a cultura da língua-alvo é amplamente desconhecida, traduzir um texto mantendo seu tom, cadência e até humor originais é uma arte delicada.

A quantidade de textos cuneiformes existentes é impressionante em contraste com o número modesto de etimologistas que podem interpretar o acadiano. Isso indica que existem tesouros inexplorados de informações sobre a significativa civilização primitiva, que às vezes é referida como o primeiro império da história. Os arqueólogos estão atualmente escavando mais tabuletas do que os linguistas traduzindo na mesma proporção do número de tabuinhas existentes. No entanto, se a inteligência artificial for incorporada ao processo de interpretação cuneiforme, isso pode mudar.

“Inúmeras tábuas de terra registradas no conteúdo cuneiforme relatam a história política, social, monetária e lógica da antiga Mesopotâmia”, escreveu o grupo. “No entanto, grande parte desses relatórios permanecem sem tradução e distantes devido ao grande número e quantidade restrita de especialistas prontos para entendê-los.”

A I.A. é capaz de dois tipos de tradução: transliteração cuneiforme (reescrevendo foneticamente) e tradução cuneiforme para o inglês. Os A.Is. a perícia nos dois tipos de interpretação obteve 36,52 e 37,47, separadamente, no Best Bilingual Assessment Student 4 (BLEU4), uma proporção da qualidade da interpretação. Ambas as pontuações foram altas o suficiente para serem consideradas traduções de alta qualidade porque foram mais altas do que a meta da equipe. O BLEU4 pontua em um tamanho de 0 a 100 (ou 0 a 1), sendo 70 o mais elevado que poderia ser razoavelmente alcançado por um intérprete humano excepcionalmente talentoso.

John Tenponater, um linguista computacional, afirmou que as traduções geradas por computador foram frágeis e pouco confiáveis por décadas. As regras gramaticais embutidas nos programas de tradução nunca levaram em consideração a profundidade do significado que pode ser encontrado na linguagem não literal e nas expressões idiomáticas que estão fora da gramática formal. As partes “mais confusas” da linguagem, por outro lado, foram recentemente acessíveis por programas de inteligência artificial como o tradutor cuneiforme. Ele marca o início de uma nova era empolgante na lingüística computacional impulsionada pela inteligência artificial.

“No final da IA, a grande novidade é o controle mensurável, que é mais um tipo de matemática, mas não o tipo de padrões inflexíveis com os quais as pessoas trabalhavam anteriormente”, disse Tenponater. ” As medições nos levaram a meio caminho das estratégias anteriores. Atualmente, estamos utilizando aprendizado profundo e aprendizado de máquina. As máquinas podem perceber essa multiplicidade de excentricidades, ditados e casos especiais para regras, que é o que estava ausente na era passada de A.I.”

Os A.Is cuneiformes. as interpretações realmente tiveram falhas críticas – e tiveram “viagens mentais” como é normal com A.I. Em um modelo, decifrou “Por que razão seria uma boa ideia para nós (da mesma forma) dirigir a reclamação perante um homem de Libbi-Ali?” como, “Eles estão no Inner City no Inner City.”

O processamento inicial dos textos pela ferramenta economizou uma quantidade significativa de tempo e trabalho humano, apesar de erros ocasionais.

“A.I. é incrível agora, mas não é confiável. Portanto, pode fazer coisas verdadeiramente surpreendentes, mas você nunca pode realmente acreditar no resultado que produz”, disse Tenponater sobre a utilização de IA. para interpretação. “Como resultado, o melhor caso de uso para a IA é quando ela requer muito trabalho manual e é difícil para os humanos concluírem, mas uma vez que a IA fornece saída, os humanos podem verificá-la facilmente.

Ao traduzir textos com frases curtas e fórmulas, como registros administrativos, o modelo foi mais preciso. Foi também – surpreendentemente para os especialistas – capaz de recriar as sutilezas explícitas da classificação na interpretação. Mais tarde, o A.I. será preparado em exemplos cada vez maiores de interpretações para trabalhar adicionalmente em sua precisão, os especialistas compostos.

Por enquanto, pode ajudar os pesquisadores, fornecendo traduções preliminares que podem ser verificadas quanto à precisão e refinamento matizado por humanos.

De acordo com os pesquisadores, “um cenário futuro promissor faria com que o [modelo] mostrasse ao usuário uma lista de fontes nas quais eles basearam suas traduções, o que também seria particularmente útil para fins acadêmicos”.

Língua antiga com um milhão de textos são decifrados por IA

ÚLTIMAS NOTÍCIAS

O que causa flatulência?

Horóscopo Chinês de nove de maio de 2024

Horóscopo de nove de maio de 2024

Quem agrega mais para ser vice de Eduardo Pimentel?

hot news

Astronautas encontram maneira de não atrofiar os músculos no espaço

Brasileiro usa espada para assassinar adolescente na Inglaterra

Orangotango é filmado cuidando da própria ferida

Quem agrega mais para ser vice de Eduardo Pimentel?

ARTIGOS RELACIONADOS

Novo propulsor da NASA promete viabilizar viagens interplanetárias

Inteligência Artificial está analizando o lixo alheio

Como prolongar a vida útil do telefone celular

Como editar mensagens e ocultar visualização no instagram

DEIXE UM COMENTÁRIO Cancelar comentário

Tecnologia corrige o ‘viés asiático’ em imagens geradas por IA

Drone espião está circulando camuflado no espaço aéreo