OSTA es el acrónimo de Old Spanish Textual Archive, un corpus de más de treinta millones de palabras de textos en castellano antiguo, navarro-aragonés, asturiano, leonés y aragonés basado en las transcripciones de 400 textos medievales. Realizado por Francisco Gago Jover y Javier Pueyo Mena, es una fuente interesantísima para el estudio de las lenguas peninsulares del medievo.
La labor de etiquetado, metadesignación y lematización ha sido importante y, fruto de ello, el buscador es muy potente, permitiendo búsquedas y clasificaciones muy variadas.
El siguiente artículo de los autores explica los métodos y procedimientos utilizados en la creación de OSTA.
Se puede acceder al buscador y al corpus desde este enlace.
No hay comentarios:
Publicar un comentario