15/5/26

SNAP: Sistema para generar narraciones interactivas

 


Se publicó a finales del año anterior el artículo SNAP: A Plan-Driven Framework for Controllable Interactive Narrative Generation, escrito por los surcoreanos Geonwoo Bang, DongMyung Kim, Hayoung Oh y Sungkyunkwan University.

Este trabajo aborda un problema fundamental en los sistemas narrativos interactivos basados en modelos de lenguaje de gran escala (LLMs): las distorsiones espaciotemporales. Cuando un usuario formula preguntas que van más allá de los límites de la escena actual, el modelo tiende a revelar información sobre eventos futuros o lugares que el personaje aún no debería conocer, rompiendo así la coherencia narrativa y la inmersión del usuario. Las soluciones existentes, como establecer restricciones basadas en reglas o en ajustes delicados del prompt, resultan insuficientes en diálogos de múltiples turnos donde las entradas del usuario son impredecibles.

Para resolver este problema, los autores proponen SNAP (Story and Narrative-based Agent with Planning), un marco de trabajo que estructura la narrativa en unidades denominadas celdas (Cells) y asocia a cada una un plan explícito. Cada celda encapsula un segmento de la historia de aproximadamente diez frases, junto con las personalidades de los personajes, un resumen del contexto previo y las entradas del usuario. Al limitar el contexto disponible para el agente únicamente a la celda actual, se evita que acceda a eventos futuros. El plan generado para cada celda especifica los objetivos narrativos, los detalles de la acción y las restricciones de información. Para seleccionar el mejor plan entre varias posibilidades, se utiliza una función de puntuación que pondera la coherencia semántica, la conectividad lógica y la consistencia de personalidad. El agente de diálogo emplea además una estrategia de tres pasos ante desviaciones que provoque el usuario: reconocer la entrada, responder brevemente con información contextual y redirigir la conversación hacia el objetivo narrativo previsto. Al concluir la narración en cada celda, un algoritmo resumen condensa lo ocurrido para alimentar la siguiente unidad sin sobrecargar el contexto.

La evaluación del sistema se realizó sobre 13 argumentos extraídos del conjunto de datos Wikiplot, combinando métricas automáticas y una prueba con 23 participantes humanos. SNAP superó al sistema base (GPT-4o sin estructura) en todas las dimensiones medidas: continuidad narrativa, adecuación de la información revelada, no redundancia y linealidad. Los resultados humanos fueron especialmente reveladores, con mejoras de hasta un 65% en no redundancia y un 57,7% en continuidad. El estudio confirmó que tanto la segmentación en celdas como la generación guiada por planes son componentes necesarios para mantener la escalabilidad en narrativas largas.

Los autores concluyen que SNAP ofrece una base sólida para la generación narrativa controlable en aplicaciones web interactivas, como videojuegos en navegador, plataformas educativas y ficción interactiva, equilibrando de forma efectiva la libertad conversacional del usuario con la coherencia narrativa definida por el creador.

Puede leerse completo desde este enlace.



0 comentarios :