TextDigester es un programa de procesamiento de lenguaje que genera resúmenes de manera automática. El trabajo ganó hace pocos meses el primer premio del evento Hackathon de Tecnologías del Lenguaje . Los autores son Francesco Ronzano y Horacio Saggion, de la Universidad Pompeu Fabra. La aplicación analiza textos que pueden provenir de páginas HTML, documentos XML, feeds RSS u objetos JSON que son los más usados en las páginas de noticias o las redes sociales. Tras detectar el idioma en el que el texto está escrito, el programa ejecuta un análisis léxico y un análisis semántico a fin de detectar las palabras y conceptos clave del artículo, procediendo posteriormente a realizar el resumen extrayendo del texto las frases que más peso tienen respecto a lo conceptos detectados.
Más información en este enlace.
No hay comentarios:
Publicar un comentario