Cómo la ciencia está descifrando lenguas antiguas con inteligencia artificial.
Anuncios
La ciencia está descifrando lenguas antiguas con inteligencia artificial. —y lo que parecía un sueño de ciencia ficción ya ha comenzado a suceder silenciosamente, dentro de laboratorios y archivos digitales.
Trozos de arcilla quemada, placas de bronce corroídas, fragmentos de papiro apenas capaces de mantenerse unidos: durante siglos, estos objetos han conservado voces que nadie podía oír correctamente.
De repente, los algoritmos son capaces de sugerir lo que falta, conectar lo que está disperso y, a veces, revelar significados que han pasado desapercibidos para generaciones de expertos.
No es magia.
Es el resultado de una convergencia brutal: toneladas de datos digitalizados, modelos neuronales que han aprendido a "leer" el contexto histórico y, lo que es más importante, investigadores dispuestos a compartir el protagonismo con la máquina.
¡Sigue leyendo el texto!
Resumen
- ¿Por qué precisamente ahora? La ciencia está descifrando lenguas antiguas con inteligencia artificial.?
- ¿Cómo pueden estas máquinas "comprender" algo que ni siquiera los humanos comprendieron del todo?
- ¿Qué escritos están siendo objeto de análisis y cuáles aún resisten?
- Dos casos que demuestran lo que realmente ha cambiado.
- ¿Qué ganamos, qué perdimos y cómo afecta esto a nuestra comprensión del pasado?
- Preguntas que la gente hace con más frecuencia (en la tabla)
¿Por qué ahora exactamente?

No fue un gran momento de "eureka" tecnológica aislado. Fue una combinación perfecta de circunstancias.
En primer lugar, las colecciones. Museos y universidades han dedicado las últimas dos décadas a escanear, fotografiar en alta resolución e indexar todo lo que han podido.
Existen decenas de miles de inscripciones griegas, latinas, cuneiformes y jeroglíficas, material que anteriormente permanecía guardado bajo llave en cajones o en publicaciones con tiradas mínimas.
En segundo lugar, la arquitectura de los modelos. Herramientas como Aeneas (DeepMind, 2025) ya no tratan el texto como una secuencia de caracteres.
Construyen representaciones vectoriales que combinan la escritura a mano, la fecha, el lugar del descubrimiento, el estilo de la forma e incluso los rasgos estilísticos del escriba.
Es como si la máquina hubiera desarrollado una especie de "intuición histórica".
En tercer lugar, y quizás lo más decisivo, está el cambio de actitud entre los investigadores.
Muchos han dejado de ver la IA como una amenaza y han comenzado a tratarla como una colaboradora incansable (y un tanto obsesiva).
El ciclo se retroalimenta: más textos restaurados → mejor formación → más textos restaurados.
Y en medio de todo esto, el La ciencia está descifrando lenguas antiguas con inteligencia artificial. Deja de ser un titular futurista y se convierte en información periodística rutinaria.
Lea también: La ciencia detrás del Déjà Vu: ¿Mal funcionamiento cerebral o mecanismo de protección?
¿Cómo logran estas máquinas "entender"?
No lo entienden. Reconocen patrones a una escala sobrehumana.
El proceso comienza con una formación exhaustiva sobre corpus ya descifrados.
La red aprende no solo palabras, sino también rituales administrativos, fórmulas legales, variaciones dialectales regionales e incluso errores sistemáticos cometidos por escribas apresurados.
Cuando llega un nuevo fragmento con lagunas, el modelo genera docenas de hipótesis ordenadas por probabilidad y resalta visualmente qué partes del contexto influyeron más en cada sugerencia.
Eneas, por ejemplo, puede cotejar en segundos un diploma militar romano hallado en Cerdeña con otros 1.800 diplomas similares, señalando paralelismos que a un investigador le llevaría meses encontrar en su memoria o en archivadores.
Pero la clave del éxito reside en la interfaz: el experto mantiene el control.
Él observa el mapa de atención de la red, discrepa, lo corrige y explica el porqué. La máquina aprende de la discrepancia.
Imagínelo como un arqueólogo que, después de cuarenta años de excavaciones, finalmente consigue un asistente que ha leído todos los informes de excavación del planeta y que nunca duerme.
El asistente comete errores graves en lo que respecta a los matices culturales, pero acierta con patrones que escapan al ojo humano.
EL La ciencia está descifrando idiomas los antiguos con IA Porque descubrimos que la combinación de ambas perspectivas —la mirada humana, lenta y profunda, más la mirada rápida y exhaustiva de la máquina— es más poderosa que cualquiera de ellas por separado.
¿Qué escritos están siendo objeto de análisis y cuáles aún resisten?
Quienes tienen más "combustible" para entrenar avanzan más rápido.
El griego clásico y el latín predominan porque contamos con volumen y variedad: miles de inscripciones públicas, contratos, epitafios, monedas y diplomas militares.
++ Por qué el tiempo pasa tan rápido: datos interesantes que realmente lo explican.
El proyecto Ítaca (que más tarde evolucionó hasta convertirse en Eneas) ya está logrando impresionantes índices de precisión en intervalos cortos.
El egipcio —jeroglíficos, hierático, demótico— también se popularizó.
Los sistemas más recientes combinan la visión artificial con el modelado lingüístico y son capaces de procesar ostracas (fragmentos de cerámica) cuyo estilo varía según la región y el escriba.
Resultado: las diferencias administrativas entre Alejandría y Tebas que antes pasaban desapercibidas ahora se hacen evidentes en cuestión de minutos.
La escritura cuneiforme hitita, sumeria y acadia avanzó más lentamente, pero se aceleró con bases de datos como el Thesaurus Linguarum Hethaeorum Digitalis.
El Lineal A, el Rongorongo, la escritura de la civilización del valle del Indo... siguen siendo en gran parte desconocidos. Existen muy pocos textos, no hay claves bilingües y el contexto cultural está muy fragmentado.
La IA puede detectar patrones estadísticos, pero sin un ancla semántica, flaquea.
Y quizás sea mejor así: algunos misterios aún deben esperar a que las personas los resuelvan, no las GPU.
Dos casos que demuestran cuánto ha cambiado ya.
1. Diploma militar de bronce, Cerdeña, 113-114 d. C.
Fragmentado, con texto parcial.
Tradicionalmente, alguien dedicaba semanas a cotejar otros diplomas conocidos para intentar comprender a quién se le había concedido la ciudadanía.
En este sentido, Eneas encontró paralelismos con los documentos de Trajano en Germania y Panonia, sugirió restauraciones coherentes y reveló que el beneficiario pertenecía a una unidad auxiliar que había luchado en Dacia.
En resumen, lo que era simplemente una lista de nombres se convirtió en una ventana a la política de integración romana en las provincias. Un detalle que cambia la narrativa.
2. Ostraca ptolemaica (siglos III-I a. C.)
Una colección de fragmentos que contienen jeroglíficos y escritura demótica, muchos de ellos dañados.
El sistema presentado en SIGGRAPH 2025 procesaba todo de forma conjunta: transcribía, traducía y mapeaba las variaciones regionales de las señales.
De este modo, se descubrió que ciertas fórmulas administrativas utilizadas en Tebas no aparecían en Alejandría, lo que indica una mayor descentralización de la que se había imaginado anteriormente en la burocracia ptolemaica.
Hoy en día, los estudiantes utilizan la misma herramienta para practicar la lectura, algo que antes requería años de práctica con facsímiles impresos.
¿Qué ganamos, qué perdimos y cómo afecta esto a nuestra comprensión del pasado?
Hemos ganado en velocidad y escalabilidad. Textos que antes requerían toda una carrera profesional ahora pueden ser analizados por pequeños equipos en tan solo unos meses.
Hemos conseguido acceso: las herramientas de código abierto permiten a investigadores de Brasil, Turquía y Egipto trabajar con el mismo material que antes requería viajar a Londres o Berlín.
En este sentido, perdemos parte del romanticismo del desciframiento solitario: ese momento en que el filólogo, después de diez años, comprende el significado de un signo.
Y existe un riesgo real de sesgo: las lenguas con textos mejor conservados dominan la formación, mientras que las lenguas marginadas se vuelven aún más invisibles.
Pero quizás el mayor efecto sea epistemológico. Cuando la máquina sugiere una interpretación y el ser humano la valida (o la refuta), estamos redefiniendo lo que se considera "evidencia" en la historia.
El pasado deja de ser un museo de certezas y se convierte en un diálogo continuo entre fragmentos, probabilidades e interpretación.
Y eso, en el fondo, resulta inquietante: significa que algunas de nuestras narrativas más arraigadas sobre Grecia, Roma y Egipto podrían estar a punto de recibir importantes matices.
En resumen, ¿estamos realmente preparados para un pasado que responde más rápido de lo que imaginábamos?
La ciencia está descifrando lenguas antiguas con IA: Comparación directa
| Aspecto | Antes (solo humanos) | Ahora (humanos + IA) | Se nota una diferencia real |
|---|---|---|---|
| Tiempo promedio por fragmento | Semanas a meses | De minutos a unas pocas horas | Economías de escala brutales |
| Precisión en intervalos cortos | ~20–30% | 62–78% (dependiendo del corpus) | Hipótesis más viables |
| Capacidad para hacer referencias cruzadas a los textos. | Limitado a la memoria y la bibliografía | Miles de documentos en segundos | El contexto explota |
| Acceso para investigadores | Concentrados en grandes centros | Digital y gratuito en la mayoría de los casos. | Democratización concreta |
| Enfoque principal del especialista | Transcripción y paleografía | Interpretación histórica y cultural | Más espacio para la reflexión. |
Preguntas que la gente hace con más frecuencia
| Pregunta | Respuesta directa |
|---|---|
| ¿Alguna vez la IA ha descifrado un guion completamente desconocido? | No. Necesitas una cantidad razonable de texto, además de contexto o un paralelismo conocido. |
| ¿Reemplazará ella a los egiptólogos y asiriólogos? | No lo reemplaza. Realiza el trabajo manual y sugiere; el juicio profundo sigue siendo humano. |
| ¿Qué sistema de escritura se prevé que experimente el mayor avance entre 2026 y 2027? | El griego y el latín siguen siendo los idiomas predominantes; el egipcio y el hitita les siguen. |
| ¿Son los resultados lo suficientemente fiables como para ser publicados? | Solo después de una rigurosa revisión humana. Los honorarios varían considerablemente según el caso. |
| ¿Dónde puedo probar estas herramientas? | Plataformas DeepMind (Aeneas/Ithaca), TLH dig y repositorios de SIGGRAPH 2025. |
EL La ciencia está descifrando lenguas antiguas con inteligencia artificial. No se trata solo de recuperar palabras perdidas.
De esta forma, se devuelve la capacidad de decisión a voces que el tiempo ha intentado borrar y, de paso, se nos obliga a replantearnos cuánto del pasado controlamos realmente.
Para ir más allá:
