El interesante trabajo que puede leerse aquí explica cómo pueden ser utilizados los ordenadores para descifrar lenguas muertas.
Utilizando la estadística y las reglas lógicas que han guiado los trabajos de investigadores anteriores, los investigadores que firman el análisis - Benjamin Snyder, Regina Barzilay y Kevin Knight- lograron descifrar textos del ugarítico (una lengua semítica) con un notable acierto, descifrando correctamente 29 de las 30 del alfabeto y deduciendo un 60% de las palabras.
El algoritmo necesita que se introduzca el texto desconocido a descifrar y un corpus no paralelo de otra lengua relacionada. Entonces, mediante técnicas estadísticas pueden extraerse patterns (rasgos o modelos) que pueden extrapolarse al otro lenguaje. Así, la frecuencia de aparación de ciertas letras, el reconocimiento de terminaciones o sufijos, determinación de conjunciones, etc.
El documento explica otras técnicas avanzadas que, aplicadas en su conjunto, logran una eficacia interesante en la decodificación.
No hay comentarios:
Publicar un comentario