12/6/15

Generador de textos por cadenas de Markov



Las cadenas de Markov son un instrumento matemático que, aplicado al tratamiento del lenguaje, permite  la creación de textos que parecen tener el estilo de un autor dado. Resumiendo mucho, la técnica determina qué letra (o palabra) debe aparecer tras una, dos, tres o varias letras (o palabras) en función de la distribución dada en un texto. Así, si- supongamos- en una novela, siempre que aparecen las palabras "es un día", en este orden, la siguiente palabra es "feliz", el método asignará una probabilidad del 100% a que tras "es un día", ese autor va a escribir "feliz". Si, por el contrario, tras "es un día" aparecieran tantos "feliz" como "triste", la probabilidad asignada sería 50% a cada caso. Entonces, podemos determinar las probabilidades de un texto dado y, luego, a partir de otro texto semilla ir construyendo uno nuevo calculando qué palabra es la más probable que siga.

Ben Johnson ha programado una aplicación que genera nuevos textos a partir de otros aplicando las cadenas de Markov. Resultados que suelen "parecer" del mismo autor pero que se generan automáticamente con más o menos acierto.

Puede explorarse la técnica en este enlace.

Por, ejemplo, para un texto que se inicia así:

Me preocupé. Aquel mareo fue extraño, sin duda. A mi edad, uno no pierde así la cabeza si no le ocurre nada a ese cuerpo que ya empieza a flaquear. Me costó recuperarme, quizá media hora o más. Las hipótesis fueron muchas, que si bajonazo de tensión, que si dos copas de más, que si subidón de tensión, que si corte de digestión. Preocupante, en cualquier caso. Así que recurrí a un amigo médico que escuchó los hechos, circunspecto, frunciendo el ceño como todo buen galeno debe hacer para aparentar que sabe más de lo que sabe.
-          ¿Crees que puede ser algo serio? – le pregunté con preocupación.
-          No lo sé – replicó con seriedad- Un mareo puede ser producido por miles de cosas. Quién sabe a qué se ha debido esta vez. Pero – continuó- lo que es seguro es que hay que analizar las horas previas al episodio, de modo que nos vamos a sentar en un café y me vas a describir con detalle qué hiciste esa velada.


El día estaba azul  aunque algo frío. Nos sentamos en una terraza cercana a la playa y pedimos dos capuccinos que nos sirvieron acompañados de unas galletitas de mantequilla tentadoras que comimos antes de siquiera sorber el líquido.

El programa de Johnson produce:

Me preocupé. Aquel mareo fue extraño, sin duda. A mi interlocutor, porque me daba vergüenza, esa vergüenza apocada del que sabe que no quería entregarte la cajetilla de Chéster, de cómo tú y yo habíamos llegado a ese cuerpo que ya empieza a flaquear. Me costó recuperarme, quizá media hora o más. Las hipótesis fueron muchas, que si subidón de tensión, que si dos copas de más, que si bajonazo de tensión, que si bajonazo de tensión, que si corte de digestión. Preocupante, en cualquier caso. Así que recurrí a un amigo médico que escuchó los hechos, procurando recordar cada detalle. Le conté, así, de cómo me ayudaste, de cómo yo no podía dejar de mirar esa carita bendita que el cielo te ha prestado, de cómo me besaste al entrar en la facultad: Había llegado a ese cuerpo que ya empieza a flaquear. Me costó recuperarme, quizá media hora o más. Las hipótesis fueron muchas, que si corte de digestión. Preocupante, en cualquier caso. Así que recurrí a un amigo médico que escuchó los hechos, procurando recordar cada detalle. Le conté, así, de cómo la luz entreveraba reflejos y chiribitas en tu cabello, de cómo el cielo se iba tornando bermejo  y la vanagloria que me asalta desde dentro cuando te miro, de esa locura imprudente que me inundan cuando paseo junto a ti, tú a veces de mi brazo, yo siempre a tu costado sé que todos me envidian y se preguntan qué tendré yo para que una diosa me acompañe. Luego, le conté de este amor que me inundan cuando paseo junto a ti, tú a veces de mi brazo, yo siempre a tu vera.








No hay comentarios:

Publicar un comentario