Como a ciência está decifrando línguas antigas com IA

Anúncios

A ciência está decifrando línguas antigas com IA — e o que parecia um sonho de ficção científica já começou a acontecer em silêncio, dentro de laboratórios e arquivos digitais.

Pedaços de argila queimada, placas de bronze corroídas, fragmentos de papiro que mal se sustentam: durante séculos esses objetos guardaram vozes que ninguém conseguia ouvir direito.

De repente, algoritmos conseguem sugerir o que falta, conectar o que está espalhado e, às vezes, revelar sentidos que passaram despercebidos por gerações de especialistas.

Não é mágica.

É o resultado de uma convergência brutal: toneladas de dados digitalizados, modelos neurais que aprenderam a “ler” contexto histórico e, principalmente, pesquisadores dispostos a dividir o palco com a máquina.

Continue a leitura do texto!

Sumário

Por que exatamente agora a ciência está decifrando línguas antigas com IA?
Como essas máquinas conseguem “entender” algo que nem os humanos entendiam completamente?
Quais escritas estão na mira — e quais ainda resistem?
Dois casos que mostram o que já mudou de verdade
O que ganhamos, o que perdemos e o que isso mexe na nossa ideia de passado
Perguntas que as pessoas mais fazem (em tabela)

Por que exatamente agora?

Como a ciência está decifrando línguas antigas com IA

Não foi um grande “eureka” tecnológico isolado. Foi uma tempestade perfeita de condições.

Primeiro, os acervos. Museus e universidades passaram as últimas duas décadas escaneando, fotografando em alta resolução e indexando tudo o que podiam.

São dezenas de milhares de inscrições gregas, latinas, cuneiformes, hieróglifos — material que antes vivia trancado em gavetas ou em publicações de tiragem irrisória.

Segundo, a arquitetura dos modelos. Ferramentas como o Aeneas (DeepMind, 2025) não tratam mais o texto como sequência de caracteres.

Elas constroem representações vetoriais que misturam escrita, datação, local de achado, estilo formulário e até traços estilísticos do escriba.

É como se a máquina tivesse desenvolvido uma espécie de “intuição histórica”.

Terceiro — e talvez o mais decisivo —, a mudança de atitude dos pesquisadores.

Muitos deixaram de ver a IA como ameaça e passaram a tratá-la como colaboradora incansável (e um pouco obsessiva).

O ciclo se retroalimenta: mais textos restaurados → melhor treinamento → mais textos restaurados.

E, no meio disso, a ciência está decifrando línguas antigas com IA deixa de ser manchete futurista e vira rotina de bancada.

Como essas máquinas conseguem “entender”?

Elas não entendem. Elas reconhecem padrões em escala sobre-humana.

O processo começa com treinamento massivo em corpora já decifrados.

A rede aprende não só palavras, mas rituais administrativos, fórmulas jurídicas, variações dialetais regionais, até erros sistemáticos de escribas apressados.

Quando chega um fragmento novo com lacunas, o modelo gera dezenas de hipóteses ordenadas por probabilidade — e destaca visualmente quais trechos do contexto influenciaram mais cada sugestão.

O Aeneas, por exemplo, consegue cruzar um diploma militar romano achado na Sardenha com outros 1.800 diplomas semelhantes em segundos, apontando paralelos que um pesquisador levaria meses para encontrar na memória ou em fichários.

Mas o pulo do gato está na interface: o especialista continua no comando.

Ele vê o mapa de atenção da rede, discorda, corrige, explica por quê. A máquina aprende com o desacordo.

Pense nisso como um arqueólogo que, depois de quarenta anos cavando, finalmente ganhou um assistente que leu todos os relatórios de escavação do planeta e nunca dorme.

O assistente erra feio em nuances culturais, mas acerta em padrões que escapam ao olho humano.

A ciência está decifrando línguas antigas com IA porque descobrimos que a combinação dos dois olhares — o lento e profundo do humano + o rápido e exaustivo da máquina — é mais potente que qualquer um dos dois isolados.

Quais escritas estão na mira — e quais ainda resistem?

As que têm mais “combustível” para o treinamento avançam mais rápido.

Grego e latim clássico dominam porque temos volume e variedade: milhares de inscrições públicas, contratos, epitáfios, moedas, diplomas militares.

++ Por que o tempo passa rápido: coisas interessantes que realmente explicam

O projeto Ithaca (evoluído para Aeneas) já atinge taxas de acerto impressionantes em lacunas curtas.

O egípcio — hieróglifos, hierático, demótico — também disparou.

Sistemas recentes combinam visão computacional com modelagem linguística e conseguem lidar com ostraca (cacos de cerâmica) que mudam de estilo conforme a região e o escriba.

Resultado: variações administrativas entre Alexandria e Tebas que antes passavam despercebidas agora aparecem em minutos.

Cuneiforme hitita, sumério e acadiano avançam mais devagar, mas aceleraram com bases como o Thesaurus Linguarum Hethaeorum Digitalis.

Já Linear A, rongorongo, escrita da civilização do Vale do Indo… esses ainda são desertos. Pouquíssimos textos, nenhuma chave bilíngue, contexto cultural muito fragmentado.

A IA consegue detectar regularidades estatísticas, mas sem âncora semântica ela patina.

E talvez seja melhor assim: alguns mistérios ainda precisam esperar por gente, não por GPU.

Dois casos que mostram o que já mudou

1. Diploma militar de bronze, Sardenha, 113–114 d.C.

Fragmentado, com texto parcial.

Tradicionalmente, alguém passaria semanas cruzando com outros diplomas conhecidos para tentar entender a quem foi concedida a cidadania.

Nesse sentido, o Aeneas localizou paralelos com documentos de Trajano na Germânia e na Panônia, sugeriu restaurações coerentes e revelou que o beneficiário pertencia a uma unidade auxiliar que tinha lutado na Dácia.

Em suma, o que era só uma lista de nomes virou janela para a política de integração romana nas províncias. Um detalhe que muda a narrativa.

2. Ostraca ptolomaicos (século III–I a.C.)

Um lote de cacos com hieróglifos e demótico, muitos danificados.

O sistema apresentado no SIGGRAPH 2025 processou tudo em conjunto: transliterou, traduziu, mapeou variações regionais de sinais.

Dessa forma, descobriu-se que certas fórmulas administrativas usadas em Tebas não apareciam em Alexandria — indício de descentralização maior do que se imaginava na burocracia ptolomaica.

Hoje estudantes usam a mesma ferramenta para treinar leitura, algo que antes exigia anos de prática com fac-símiles impressos.

O que ganhamos, o que perdemos e o que isso mexe na nossa ideia de passado

Ganhamos velocidade e escala. Textos que exigiriam uma carreira inteira agora podem ser explorados por equipes pequenas em poucos meses.

Ganhamos acesso: ferramentas abertas permitem que pesquisadores do Brasil, da Turquia, do Egito trabalhem com o mesmo material que antes exigia passagem para Londres ou Berlim.

Nesse sentido, perdemos um pouco do romantismo da decifração solitária — aquele momento em que o filólogo, depois de dez anos, percebe o sentido de um sinal.

E há o risco real de viés: línguas com mais textos preservados dominam o treinamento, enquanto as marginalizadas ficam ainda mais invisíveis.

Mas o maior efeito talvez seja epistemológico. Quando a máquina sugere uma leitura e o humano a valida (ou derruba), estamos redefinindo o que conta como “evidência” em história.

O passado deixa de ser um museu de certezas e vira um diálogo contínuo entre fragmentos, probabilidades e interpretação.

E isso, no fundo, é inquietante: significa que algumas das nossas narrativas mais consolidadas sobre Grécia, Roma, Egito podem estar prestes a ganhar asteriscos grandes.

Em suma, será que estamos mesmo preparados para um passado que responde mais rápido do que imaginávamos?

Ciência está decifrando línguas antigas com IA: Comparação direta

Aspecto	Antes (só humanos)	Agora (humanos + IA)	Diferença real sentida
Tempo médio por fragmento	Semanas a meses	Minutos a poucas horas	Ganho brutal de escala
Precisão em lacunas curtas	~20–30%	62–78% (dependendo do corpus)	Mais hipóteses viáveis
Capacidade de cruzar textos	Limitada à memória e bibliografia	Milhares de documentos em segundos	Contexto explode
Acesso para pesquisadores	Concentrado em grandes centros	Digital e gratuito na maioria dos casos	Democratização concreta
Foco principal do especialista	Transcrição e paleografia	Interpretação histórica e cultural	Mais espaço para pensamento

Perguntas que as pessoas mais fazem

Pergunta	Resposta direta
A IA já decifrou algum script completamente desconhecido?	Não. Precisa de quantidade razoável de texto + contexto ou paralelo conhecido.
Ela vai substituir os egiptólogos e assiriólogos?	Não substitui. Faz o trabalho braçal e sugere; o julgamento profundo segue humano.
Qual escrita deve ter o maior avanço em 2026–2027?	Grego e latim ainda lideram; egípcio e hitita vêm logo atrás.
Os resultados são confiáveis o bastante para publicação?	Só depois de revisão humana rigorosa. Taxas variam muito conforme o caso.
Onde eu consigo experimentar essas ferramentas?	Plataformas da DeepMind (Aeneas/Ithaca), TLH dig, e repositórios SIGGRAPH 2025.

A ciência está decifrando línguas antigas com IA não está apenas recuperando palavras perdidas.

Dessa forma, Está devolvendo agência a vozes que o tempo tentou apagar — e, de quebra, nos obrigando a repensar o quanto do passado nós realmente controlamos.

Para ir além:

Ciência em Destaque

Andre Neri 17 de março de 2026