8/6/17

TextDigester





TextDigester es un programa de procesamiento de lenguaje que genera resúmenes de manera automática. El trabajo ganó hace pocos meses el primer premio del evento Hackathon de Tecnologías del Lenguaje . Los autores son Francesco Ronzano y Horacio Saggion, de la Universidad Pompeu Fabra. La aplicación analiza textos que pueden provenir de páginas HTML, documentos XML, feeds RSS u objetos JSON que son los más usados en las páginas de noticias o las redes sociales. Tras detectar el idioma en el que el texto está escrito, el programa ejecuta un análisis léxico y un análisis semántico a fin de detectar las palabras y conceptos clave del artículo, procediendo posteriormente a realizar el resumen extrayendo del texto las frases que más peso tienen respecto a lo conceptos detectados.

Más información en este enlace.




No hay comentarios:

Publicar un comentario