23/8/19

Descifrando lenguajes extintos




Jiaming Luo y Regina Barzilay del MIT junto a Yuan Cao de Google’s AI lab en California han desarrollado un sistema de inteligencia artificial que presumiblemente permite traducir lenguajes extintos cuya traducción se desconoce aún. Lenguajes de este tipo son por ejemplo el llamado "Lineal A" de la cultura minoica, el Wadi el-Hol en Egipto, el rongo-rongo, ciertas tablillas olmecas o el protoelamita.


Una manera ya conocida de abordar la traducción de lenguajes desconocidos era suponerlos similares a otro cercano en geografía y en el tiempo. En tal caso, puede suponerse que las palabras que designan conceptos parecidos se relacionan entre ellas de manera similar en todos esos idiomas cercanos. Relaciones entre elementos (mesa y mesilla, comer y comida) o entre la manera de construir las frases. Con una base de datos muy grande del lenguaje conocido, se establecen esas relaciones entre palabras. Esos patrones pueden buscarse entonces sobre el idioma desconocido para detectar si también se dan y encontrar relaciones y traducciones.

Pero en muchos lenguajes extintos, no hay un corpus de palabras suficiente para comparar nada, de modo que el método anterior es inaplicable. Es aquí donde el nuevo sistema entra en juego. En este, se supone que los idiomas evolucionan de manera similar los unos a los otros, al menos dentro de un marco temporal-geográfico determinado, con sólo un conjunto reducido de reglas. Por ejemplo, cabe suponer que los símbolos que describen los sonidos (sean letras o palabras) deben ser similares o, al menos, tener distribuciones similares, o haber evolucionado de manera similar. Puede suponerse también que palabras relacionadas en el primer idioma mantienen también cierto orden de consonantes en el segundo (por ejemplo si pasamos de mesa a mesilla, puede admitirse que la serie m-s-l se mantendrá también en el idioma desconocido), etc. Con todo este conjunto de reglas, el sistema busca encontrar patrones del lenguaje conocido en el desconocido. En ningún caso, la máquina “entiende” los idiomas. Tan sólo establece comparaciones matemáticas entre patrones.

En el trabajo de los investigadores, se aplicó el sistema experto al ugarítico – un antecesor del hebreo- y al Lineal B minoico – un antecesor del griego-, ambos conocidos y descifrados, suficientemente cercanos en tiempo y espacio. Supusieron que el ugarítico era el lenguaje conocido y se propusieron traducir el Lineal B como si este nunca hubiera sido descifrado. Crearon los patrones del ugarítico y los aplicaron al Lineal B. El resultado ha sido muy interesante. Casi el 68% de los textos minoicos son traducidos con precisión. Quiere esto decir que partiendo de un idioma conocido  puede traducirse uno desconocido.

El paper no aborda la aplicación del sistema a descifrar el Lineal A, desconocido aún.  Este sería el auténtico reto. No queda claro si es porque falta un idioma conocido cercano (no puede asegurarse que el Lineal B lo sea) o porque ya han hecho la prueba y no ha funcionado bien.

En cualquier caso, se trata de ideas  y desarrollos muy interesantes que, perfeccionados, pueden revolucionar nuestra comprensión de los idiomas más antiguos. Una muestra de cómo la computación puede ayudar a la lingüística.

El artículo original, con parte de su desarrollo matemático, puede verse en este enlace.




0 comentarios :