10/2/20

Reconocimiento digital de caligragía árabe





Los programas que crean un texto digital a partir de un texto escrito con alfabeto occidental son ampliamente usados en el mundo (OCR, etc), aunque su calidad es muy variable dependiendo del sistema.

Más complicado ha resultado hasta ahora efectuar la misma operación con alfabetos árabes en los que el reconocimiento de los caracteres es más complicado y menos estudiado.

El sistema Transkribus, usado habitualmente para la catalogación de documentos históricos, puede usarse para el reconocimiento de textos árabes según un trabajo de la Dra. Adi Keinan-Schoonbaert, pero no si hacer un trabajo previo bastante importante que pasa por hacer transcripciones manuales que enseñen al sistema automático y una segmentación de los diversos párrafos. Una vez que se ha finalizado el proceso de aprendizaje, el programa es entonces de realizar un buen trabajo transcribiendo los textos manuales a digitales.

Más información en este enlace.



No hay comentarios:

Publicar un comentario