30/4/25

Descifrado de escritura cuneiforme por IA

 


Todos hemos sentido alguna vez la impotencia de entender la letra de alguna receta médica. Si unimos los nombres de los medicamentos a la letra estrambótica de algunos galenos, la tarea de leer las recetas es digna de una epopeya.

Imaginemos lo complejo que ha de ser descifrar manuscritos de hace 5000 años escritos en cuneiforme, con un idioma extinto, unos asuntos desconocidos y una cultura lejana y perdida.

Existen cientos de miles de tablillas de arcilla escritas en cuneiforme que han aún de descifrarse y el problema no es tanto la traducción sino en reconocer los caracteres ya que, como ahora y siempre, la caligrafía es variable entre personas y entre diferentes momentos de la historia.

La IA llega para ayudarnos en este objetivo de leer esas tablillas.

Investigadores de Cornell y la Universidad de Tel Aviv (TAU) han desarrollado un método llamado ProtoSnap que hace encajar en su lugar un prototipo de un personaje para ajustarlo a las variaciones individuales impresas en una tableta. Con este nuevo método pueden hacer una copia exacta de cualquier carácter y reproducir tablillas enteras. A partir de los escaneos de fotografías de las tablillas, la IA de ProtoSnap permite suponer el personaje y, a partir de ahí, deducir qué carácter ha escrito. 

Rachel Mikulinsky, estudiante de máster y coautora de TAU, se ha presentado "ProtoSnap: Prototype Alignment for Cuneiform Signs" en la Conferencia Internacional sobre Representaciones de Aprendizaje (ICLR)

El equipo aplicó un modelo neuronal de difusión -un tipo de modelo generativo de IA que suele utilizarse en la generación de imágenes- para calcular la similitud entre cada píxel de una imagen de un personaje en una tableta y un prototipo general del personaje. A continuación, alinearon las dos versiones y ajustaron la plantilla para que coincidiera con los trazos del personaje real. Los caracteres recortados también pueden utilizarse para entrenar modelos de inteligencia artificial que realicen el reconocimiento óptico de caracteres, es decir, que conviertan las imágenes de las tabletas en texto legible por máquina. Los investigadores demostraron que, cuando se entrenan con estos datos, los modelos posteriores reconocen mucho mejor los caracteres cuneiformes, incluso los que son raros o presentan muchas variaciones.

El paper es realmente interesante y puede leerse completo en este enlace.




 

0 comentarios :