21/5/12

Pentametron




Pentametron es un generador de sonetos que utiliza como base de datos de palabras y frases textos que toma de Twitter. Funciona en inglés y el algoritmo es capaz de encontrar mensajes de la red con la rima adecuada a cada estrofa e incluso en el ritmo y la métrica hace un buen trabajo siguiendo el patrón de pentámetro yámbico de Shakespeare.

El algoritmo incorpora varias fases de análisis. Primero elimina "emoticonos" y evalúa si es un texto o no. Después analiza la forma de pronunciación de cada palabra con una base de datos propia de modo que puede decidir si cumple con el patrón yámbico. Si lo es, se almacena. Si no, se elimina. Luego, sólo queda comprobar la rima.

Evidentemente, el resultado literario es pobre pero el programa sí demuestra parte de la potencialidad del ordenador en análisis de texto. Una ejemplo de la primera estrofa de un soneto.

I was a boss in San Andreas though.
I wish tomorrow was an orange day 

we only argue when the lakers play 
Its barely even raining anymore