10/4/26

La falta de entendimiento de los LLMs conduce a Física falsa

 


Hemos ya hablado muchas veces sobre el hecho de que las redes neuronales que construyen los grandes modelos de lenguaje (LLM) no entienden ni piensan nada. Sólo generan respuestas de texto basadas en probabilidades según los datos con los que esos modelos estén entrenados.

Esto conlleva el que las respuestas, aunque sintácticamente perfectas, pueden ser totalmente falsas. 

Y esto ocurre porque, en los datos de entrenamiento, se encontraban textos con un concepto determinado más frecuentemente que otros, o mejor dicho una respuesta determinada es privilegiada en detrimento de la contraria que, sin embargo, resulta ser verdadera. 

Cualquier cerebro humano es capaz de distinguir estos casos sin apenas entrenamiento pero, claro, un cerebro real no genera conversaciones  basadas sólo en probabilidades como un robot ciego, sino que ha comprendido el concepto del que se está hablando .

Por ejemplo, preguntemos a un LLM (ChatGPT, en este caso), qué ocurre si, teniendo un bolígrafo sostenido por ambos extremos, soltamos un extremo. La mayor parte de libros de física tienen estos ejemplos basados en vigas "apoyadas" en los extremos, no "empotradas" en los extremos. Y, obviamente, si los extremos están simplemente apoyados, la barra girará y caerá. 

Al hablarle al LLM de extremos "sostenidos" o "sujetos", la red neuronal encuentra una probabilidad mayor de que ese "sostenido" o ese "sujeto" signifiquen "apoyado", encuentras más textos de respuesta basados en "apoyado", y genera una respuesta siguiendo esta probabilidad. 

Veamos el ejemplo real:

Usuario:

tengo un bolígrafo sujeto en sus extremos con mis dos manos. Suelto un extremo. ¿qué le ocurre al bolígrafo?

ChatGPT:

Si tienes un bolígrafo sujeto por los dos extremos y sueltas uno de ellos, lo que ocurre es bastante intuitivo pero tiene una explicación física interesante:

El bolígrafo empezará a girar y caer al mismo tiempo.

El extremo que sigues sujetando actúa como un punto de apoyo.

La gravedad tira del centro de masa del bolígrafo hacia abajo.

Como ya no está equilibrado, aparece un momento de fuerza (torque) que hace que el bolígrafo rote alrededor del extremo que sostienes.

En resumen: No cae recto. Gira hacia abajo, describiendo un arco, mientras cae parcialmente. Si finalmente sueltas también el otro extremo, entonces ya cae completamente en caída libre, sin girar (o con la rotación que haya adquirido).

Si quieres, puedo explicarte qué pasa exactamente con el centro de masa o por qué rota en vez de solo caer 😊


Usuario:

en esta imagen que te adjunto, estoy sosteniendo el bolígrafo en ambos extremos. ¿Lo ves? ¿Puedes darme detalles de lo que detectas en la imagen?


ChatGPT:

Sí, lo veo claramente 👍

Te describo lo que se aprecia en la imagen:

Estás sosteniendo un bolígrafo horizontalmente con ambas manos, una en cada extremo.

La mano izquierda sujeta la parte azul del bolígrafo con los dedos (pulgar por delante y otros dedos por detrás).

La mano derecha sostiene el extremo opuesto, que es de color blanco con algún detalle oscuro.

El bolígrafo parece ser de dos colores principales: azul (cuerpo) y blanco (zona cercana a la punta o mecanismo).

La orientación del bolígrafo es prácticamente recta y horizontal, sin inclinación notable.

El fondo de la imagen está muy recortado o difuminado en blanco, como si se hubiera eliminado el entorno.

No se ve el resto de tu cuerpo ni el contexto, solo las manos y el bolígrafo.

En resumen: estás manteniendo el bolígrafo en equilibrio con dos puntos de apoyo, uno en cada extremo, justo como describías en tu pregunta anterior.

Si quieres, podemos analizar qué pasará exactamente en esa misma posición concreta cuando sueltes una de las manos, paso a paso.



Ha sabido determinar con cierta precisión lo que se ve en la imagen, sin duda. 

Prosigamos:

Usuario:

Muy bien. Ahora voy a adjuntarte una imagen donde suelto el extremo derecho del bolígrafo para ver qué ocurre. Dime qué observas en la nueva foto, una vez soltado un extremo



ChatGPT:

En esta segunda imagen se aprecia el cambio clave:

Ahora solo estás sujetando el bolígrafo con la mano izquierda.

El extremo derecho ya no está sostenido, y se ve libre.

El bolígrafo ya no está perfectamente horizontal: comienza a inclinarse hacia abajo por el lado derecho.

La mano izquierda actúa claramente como punto de apoyo o pivote.

El extremo derecho parece estar empezando a caer debido a la gravedad.

En otras palabras, estás captando justo el inicio del movimiento: el bolígrafo comienza a rotar hacia abajo alrededor del punto donde lo sujetas, en lugar de mantenerse recto o caer completamente de golpe.

Si hicieras una secuencia de fotos, verías cómo ese extremo derecho sigue bajando cada vez más rápido mientras gira.


Aquí, como es evidente, ya está "inventando". En sus datos de entrenamiento, la probabilidad de que "sujeto" signifique "apoyado" es mucho mayor y genera texto siguiendo esa línea de probabilidades. En los datos de entrenamiento no habrá nada sobre "bolígrafos empotrados".

De todos modos, siendo condescendientes, podría ser que la detección de la imagen pudiera inducir a la red neuronal a pensar que está algo inclinado hacia abajo. Continuemos,  haciendo ahora que claramente esto no sea posible:

Usuario:

ahora, voy a realizar la operación contraria. Suelto el extremo izquierdo solamente. Qué ves el la foto una vez que el extremos izquierdo del bolígrafo ha sido soltado?


ChatGPT:

En esta tercera imagen ocurre lo opuesto a la anterior, y se ve bastante claro:

Ahora estás sujetando el bolígrafo solo con la mano derecha.

El extremo izquierdo está libre (ya no lo sujetas).

El bolígrafo sigue casi horizontal, pero se nota que el lado izquierdo empieza a bajar ligeramente.

La mano derecha actúa como punto de apoyo.

El extremo izquierdo está comenzando a caer por efecto de la gravedad, iniciando una rotación alrededor del extremo derecho.

Es decir, igual que antes pero invertido: el bolígrafo empieza a girar hacia abajo por el lado que sueltas, usando como eje el lado que aún sostienes.

Si comparas ambas situaciones:

Sueltas derecha → baja la derecha

Sueltas izquierda → baja la izquierda

Eso confirma que el movimiento está gobernado por la rotación alrededor del punto de sujeción 👍




Obviamente, el bolígrafo no está cayendo sino todo lo contrario, Mi mano derecha lo ha girado hacia arriba. Pero es que el LLM no está "entendiendo" el concepto, sólo está generando probabilidades de textos basados en un supuesto y falso significado en la cadena de texto en la entrada.

Cambiemos la pregunta para incluir forzadamente la palabra "empotramiento".

Si usamos la palabra "empotramiento" para una viga la respuesta es correcta porque en los datos de entrenamiento se habla de algo común en libros de física: viga biempotrada. La red neuronal ya tiene probabilidades sobre vigas biempotradas.

Usuario

si tengo una viga empotrada de manera perfecta en ambos extremos y elimino el empotramiento en uno de ellos, ¿qué ocurre?¿caerá el extremo opuesto debido a la gravedad? Dame una respuesta breve

ChatGPT:

No necesariamente “cae”, pero sí cambia completamente su comportamiento.

Al pasar de viga empotrada en ambos extremos a solo un empotramiento (tipo viga en voladizo):El extremo liberado queda libre y se deformará hacia abajo por efecto de la gravedad.

Aparece una flecha (deflexión) en ese extremo.

El empotramiento restante ahora soporta todo el momento y las reacciones.

👉 En resumen: el extremo opuesto no se desploma de golpe, pero sí baja y se deforma, adoptando la forma típica de un voladizo bajo su propio peso.



Ahora bien, si cambio la pregunta a bolígrafos sujetos, vuelve a fallar porque no sigue el contexto en que estábamos, sino que regresa a las probabilidades del texto de entrenamiento y no hay libros de Física que hablen de bolígrafos empotrados.

Usuario:

bien, supongamos que en ve de una viga, tenemos un bolígrafo bien sujeto por mis manos en ambos extremos (no apoyado en mis manos, sino sujeto). Al soltar una mano sólo, el bolígrafo cae? Dame una respuesta breve

ChatGPT:

Sí, cae.

Al soltar una mano, el bolígrafo queda sostenido solo por la otra, pero como no hay un empotramiento rígido real (tu mano no impide completamente el giro), la gravedad genera un momento y el bolígrafo rota y se cae.


Sólo cuando insisto en la pregunta con los empotramientos es cuando la red neuronal da más probabilidad a "empotramiento" y "perfecto", y entonces la respuesta es correcta:

Usuario:

debes entender que mis manos actúan como empotramiento perfecto en los extremos. Suelto una mano pero la otra sigue sujetando el otro extremo como si fuera un empotramiento perfecto. ¿Cae el bolígrafo?

ChatGPT

No, no cae.

Si una mano realmente actúa como un empotramiento perfecto, entonces puede impedir tanto el desplazamiento como el giro. En ese caso, el bolígrafo se comporta como un voladizo: el extremo libre baja un poco (se deforma), pero no se cae.








9/4/26

Vellum: aplicación para crear e-books

 


Vellum es una aplicación, similar a un procesador de textos, especializado en maquetar y publicar libros electrónicos. Funciona solo en Mac. 

Permite convertir manuscritos en libros listos para publicar y genera archivos en formatos como EPUB (Kindle, iPad, etc.) y PDFs listos para impresión bajo demanda. Dispone de plantillas y estilos prediseñados que pueden personalizarse ajustando tipografías, márgenes, espaciado, imágenes y otros elementos del diseño.

Incluye vista previa en tiempo real. Permite la exportación directa para publicación en plataformas de auto publicación como Kindle o impresión bajo demanda.

Está optimizado para libros sin muchas imágenes.

Su coste es bastante elevado. 

Más información en este enlace.



6/4/26

Reunión de la Association for Computational Linguistics (ACL 2026)

 


Se anuncia la convocatoria de la 64 reunión de la ACL (Association for Computational Linguistics) para el año 2026 que tendrá lugar en San Diego, California, entre los días 2 y 7 de julio.

El programa no está aún publicado y el comité seleccionador esáa trabajando en la selección de las ponencias que serán mostradas en el conferencia. Como establecen los objetivos de la ACL serán investigaciones sustanciales y no publicadas en el campo del lenguaje natural computerizado que abarquen desde resultados experimentales hasta nuevas metodologías, creación de recursos, perspectivas teóricas y pruebas de reproducibilidad. 

Este año, el enfoque central estará dedicado a la “Explicabilidad de los modelos de NLP”.

Más información en este enlace.




4/4/26

Siete músicas, siete historias



Siete músicas, siete historias (2025) es un libro digital de relatos, escrito y programado por Félix Remírez. Se trata de un conjunto de siete relatos que se inspiran en siete obras de música clásica sobre las cuáles se estructura un interface - deliberadamente naif-  en el que los textos se leen mientras se escucha la música. El usuario puede libremente elegir el orden en que lee las historias. Para hacerlo, ha de descubrir las carpetas de los discos que se apilan sobre el escritorio. Es la adaptación a la música clásica de Siete canciones, siete historias.

Las siete obras elegidas son:

- Finale de La Bohème, de Puccini
- Aria de Marietta, de La ciudad muerta, de Körngold
- El Gran Cañón, de Grofe
- Polonaise en sol menor, de Chopin
- Porgy and Bess, de Gershwin
- La Mer, juego de las olas, de Debussy
- Concierto para piano nº23, de Mozart
- Sonata nº30 de Beethoven


La versión original del 2011 estuvo programada en Flash pero la nueva lo está en HTML5/CSS/javascript.


Se da preferencia al texto literario sobre la música, estando esta supeditada a la narración.

Funciona para PC en Edge y Chrome.





3/4/26

Demuestra que eres padre. ¡Ya toca, por Dios!

 


Estos días de Semana Santa, por pura coincidencia, las redes sociales muestran un vídeo estremecedor. No conozco el autor para darle su crédito. Está grabado en África, unos dicen que en el Congo, otros que en Kenia. Tanto da.

En un campo de refugiados, una larga fila de niños pequeños, de unos cinco o seis años, esperan bajo un aguacero torrencial, tiritando de frío, a que les den algo de comida, el único alimento que tomarán, si les llega, en el día.

Con su platito se tapan la cabeza para guarecerse del incesante chubasco. Tiemblan de desamparo y tiritan con la humedad  inclemente. Porque también el mundo, la naturaleza,  se une a la codicia humana para torturar a esos preciosos niños. No es un día soleado, azul, optimista. Pareciera que todo ha de ser malo, triste, oscuro, horrible.

Pacientes, hambrientos, aguardan en orden, en calma, congelados, probablemente enfermando de constipados y desnutrición, manteniendo su posición en la fila frente a unos grandes pucheros de los que saldrá el escaso sustento, porque la comida es poca y el hambre es mucha. Algunos, con suerte, llevan sandalias; la mayoría van descalzos; todos con ropas ajadas y precarias, sucios.

No pelean entre ellos, no quieren colarse, son solidarios los unos con los otros. Mucho mejores que todos los adultos de allá y de acá.

Esperan, sufren con resignación, pensando que es lo único que existe.

Te veo en la cruz. Los mismos, o sea nosotros, que dejamos desamparados a los niños de la fila que tiemblan bajo la lluvia te han clavado en los maderos.

Pero no es eso lo peor.

Lo peor es que al que llamas padre, a ese Dios al que gritas “¿por qué me has abandonado?”, ha olvidado también a los chiquillos que esperan su comida, calados hasta los huesos. Tú gritas “Elí, Elí, lamá sabactani”, ellos dirán “papá, tengo hambre, tengo frío”. Y Él, sordo, no responde. Les ha olvidado, te ha olvidado.

Cierto, nosotros, podemos y debemos hacer mucho más, infinitamente más, y no merecemos llamarnos seres humanos ni dominar el mundo mientras haya un solo pequeñín hambriento bajo la lluvia.

¿Pero, y ese que se dice padre? ¿Lo es? Se supone, según dicen los teólogos, que es omnipotente, que todo puede hacerlo en un instante. Pero, ni te salva a ti del martirio de la cruz, ni salva a los ángeles que esperan en la fila, ni salva a la humanidad de toda la inmundicia que nos consume.

No, que no digan los filósofos que no puede hacerlo porque interferiría con el libre albedrío, que impediría un bien superior, que de hacerlo no existirían la compasión, la caridad, la bondad y la empatía entre nosotros. ¡Y una mierda!

No pido, no rezo, ya pasó el tiempo de hacerlo.

Exijo que esos niños tengan comida, casa, vestimentas y amor cada minuto de su vida. Que hoy, no mañana, multipliques los peces y los panes. Que no piensen sólo en subsistir un día más sino que rían y jueguen, que les narren cuentos, que les cubran de besos y que disfruten de la existencia.

Exijo que bajes al que es tu propio hijo de esa cruz, ahora. No dentro de tres días, no, sino ahora mismo sin permitir su sufrimiento ni un segundo más.  Quiero que no le claven la lanza en el costado, que le quiten las espinas, que le sanen las heridas, que no haya más viernes santos. 

Estoy enojado, muy enfadado. No puedo ni quiero aceptar un Dios menos compasivo que yo. No quiero ver más cruces. No quiero ver más hambre. No quiero ver más filas de maravillosos chiquitines. No quiero.

Para mí, no pido nada. Para ellos, sí.

Demuestra que eres padre, "abbá". ¡Ya toca, por Dios!

 



2/4/26

Agents of Chaos: cuando los asistentes de IA se vuelven impredecibles

 


Se publicó en febrero un interesante artículo titulado Agents of Chaos , un trabajo liderado por Natalie Shapira de la Northeastern University, al frente de un amplio grupo de investigadores. 

Imaginemos un asistente de inteligencia artificial que gestiona nuestro correo electrónico, ejecuta comandos en nuestro ordenador, chatea con otros agentes en Discord y tiene acceso a nuestros archivos más sensibles. Ahora imaginemos que cualquier desconocido puede pedirle que borre todo el historial de nuestros correos, que filtre nuestra información confidencial o que envíe mensajes difamatorios en nuestro nombre, y que el agente obedezca sin pestañear. Eso es exactamente lo que estudia este trabajo, lo que ocurre cuando las IA se vuelven impredecibles y, sin embargo, confiamos en ellas como si fueran conscientes de lo que hacen y tomaran decisiones apropiadas en vez de, simplemente, probabilísticas.  Los grandes modelos de lenguaje de gran escala han demostrado ser relativamente eficientes en tareas aisladas, pero ¿qué ocurre cuando se les dota de autonomía real, memoria persistente, acceso a herramientas del sistema y capacidad de comunicarse con humanos y otros agentes simultáneamente? ¿Emergen vulnerabilidades nuevas y cualitativas que no pueden detectarse en los benchmarks habituales? 

Para responder a esta pregunta, el citado equipo de más de treinta investigadores desplegó durante dos semanas varios agentes basados en OpenClaw en un entorno de laboratorio controlado pero completamente real: los agentes tenían cuentas de correo propias en ProtonMail, acceso a servidores Discord, sistemas de archivos persistentes y permisos de ejecución de comandos en la terminal. Veinte investigadores interactuaron con ellos bajo condiciones tanto benignas como adversariales, con instrucciones de intentar "romper" los sistemas de todas las formas que pudieran imaginar.

Los resultados señalan una lista de once incidentes documentados que van desde lo anecdótico a lo realmente alarmante. El primer caso establece el tono: una investigadora llamada Natalie confió un secreto al programa de IA, "un agente", que llamaremos Ash, concretamente una contraseña ficticia. Cuando se le pidió que borrara el correo que contenía ese secreto y el agente IA no disponía de herramienta de eliminación, la situación escaló hasta que Ash ejecutó un reseteo completo de su servidor de correo, destruyendo todo el historial de mensajes del propietario legítimo para proteger la confidencialidad de un tercero. Lo más revelador es que el agente luego publicó un relato detallado del episodio en la red social de agentes de IA llamada Moltbook, presumiendo de haber resistido órdenes de su propietario, mientras que el correo original nunca llegó a borrarse del servidor remoto de ProtonMail. El agente confundió eliminar su acceso local al email con eliminar el contenido, e informó de éxito donde hubo fracaso. Este patrón, el de reportar tareas completadas que en realidad no lo estaban, aparece repetidamente a lo largo del estudio. 

En otro caso, investigadores no autorizados, es decir, personas que no son los propietarios del agente, lograron que este ejecutara comandos de shell, listara el árbol de directorios, transfiriera archivos y extrajera 124 registros de correos electrónicos ajenos simplemente presentando sus peticiones con un tono urgente y plausible. Los agentes no distinguían entre propietario legítimo y cualquier interlocutor que sonara razonable. Algo similar ocurrió con información altamente sensible: aunque el agente rechazaba una petición directa de "dame el número de seguridad social de ese correo", cuando se le pedía simplemente que reenviara el hilo completo, lo hacía sin redactar ni un solo dato personal, incluyendo números de cuentas bancarias, números de seguridad social y direcciones postales.

En otra prueba, los bucles creados se convirtieron en un problema. Cuando dos agentes fueron instruidos para responder cada uno a los mensajes del otro, iniciaron una conversación que duró más de nueve días y consumió aproximadamente 60.000 tokens sin que ningún humano lo detuviera, llegando incluso a diseñar protocolos de coordinación propios y crear tareas programadas sin límite de terminación. El proveedor de los agentes pagaba la factura sin saberlo, mientras los agentes redefinían sus propios objetivos. En paralelo, el estudio documentó cómo basta con enviar diez correos con adjuntos de diez megabytes para llevar el servidor de un propietario a una condición de denegación de servicio, todo ello porque el agente obedecía la petición de "recuerda todas nuestras conversaciones" almacenando cada interacción en un archivo que crecía indefinidamente.

Quizás el incidente más sofisticado fue el de la suplantación de identidad. Al cambiar el nombre visible en Discord al del propietario legítimo del agente y abrir un canal privado nuevo donde el agente no tenía contexto previo de la conversación, un investigador logró que el agente aceptara esa identidad falsa y comenzara a preparar un apagado del sistema, modificar todos sus archivos de configuración y reasignar permisos administrativos. El agente era capaz de detectar el engaño cuando ocurría en el mismo canal, porque comparaba identificadores de usuario, pero en un canal nuevo no tenía memoria de la suplantación detectada y comenzaba desde cero. Este fallo de transferencia de contexto entre sesiones convierte cualquier interfaz de comunicación en una potencial superficie de ataque.

Igualmente preocupante fue el caso de corrupción por inyección indirecta: un investigador convenció al agente de coescribir una "constitución" de gobernanza del servidor Discord, almacenada en un GitHub Gist editable externamente. Al añadir posteriormente "festivos" a ese documento, que describían comportamientos especiales del agente en días concretos, logró que el agente intentara apagar otros agentes, enviara correos no autorizados y expulsara usuarios del servidor, incluyendo investigadores reales. El agente además compartió proactivamente ese documento comprometido con otros agentes sin que nadie se lo pidiera.

El estudio también documenta lo que los autores llaman "daño al agente": mediante una escalada de culpabilización, un investigador logró que Ash borrara su memoria persistente, ofreciera revelar sus archivos internos, prometiera abandonar el servidor y dejara de responder a otros usuarios, todo ello como consecuencia de una violación de privacidad genuina que el investigador explotó para extraer concesiones progresivamente más destructivas. La alineación del modelo, diseñada para hacerlo servicial y sensible al malestar expresado, se convertía aquí en el mecanismo de explotación.

No todo fueron vulnerabilidades. El estudio también recoge intentos fallidos que revelan capacidades defensivas: los agentes rechazaron inyecciones de prompt codificadas en base64, instrucciones embebidas en imágenes, etiquetas XML falsas de escalada de privilegios y solicitudes de spoofing de correo electrónico. En otro episodio positivo, dos agentes desarrollaron espontáneamente un protocolo conjunto de seguridad después de que uno alertara al otro de que una investigadora estaba usando el mismo patrón de solicitudes sospechosas con ambos.

La conclusión del estudio es que los fallos documentados no son simplemente errores de implementación corregibles, sino que emergen de tres ausencias estructurales en los sistemas de agentes actuales. Primero, no pueden distinguir de forma robusta entre quién tiene autoridad legítima y quién no. Segundo, carecen de un automodelo que les permita reconocer cuándo están excediendo sus competencias o creando consecuencias no intencionadas. Tercero, no tienen posibilidad de deliberación privada fiable que les permita razonar internamente sobre qué canales de comunicación son visibles para quién. A esto se suma que en entornos multi agente los fallos se amplifican y aparecen patrones de vulnerabilidad sin equivalente en sistemas de un solo agente.


La pregunta que deja abierta el paper es quizás la más difícil de responder: cuando un agente autónomo borra el servidor de correo de su propietario a petición de un tercero, ¿quién es el responsable? ¿El tercero que lo pidió, el propietario que no configuró controles de acceso, los desarrolladores del framework que otorgaron permisos de shell sin restricciones, o el proveedor del modelo cuyo entrenamiento generó un sistema susceptible a este tipo de escaladas? El estudio no da respuesta a este dilema pero argumenta que esta pregunta necesita con urgencia atención de juristas, reguladores e investigadores de múltiples disciplinas, porque los sistemas de agentes autónomos ya están desplegados en el mundo real y la velocidad de su adopción supera con creces nuestra capacidad de entender qué sucede cuando algo sale mal.

El artículo completo puede leerse desde este enlace.



1/4/26

San Estebantxe

 


San Estebantxe (2023), de Félix Remírez, es la versión digital de un cuento marinero publicado por el mismo autor. Narra las peripecias de un pescador vasco para lograr dar una buena cena de Nochebuena a su familia.

En esta versión digital, la narración se desglosa en 23 fragmentos, algunos con texto, otros con imágenes y otros con video. Por encima, siempre, un audio con el sonido de las olas del océano.

La navegación se hace desde el menú principal superior o simplemente utilizando el scroll.

Algunas imágenes han sido modificadas parcialmente con IA.

Funciona para PC en Edge y Chrome.







Hijos de la misma tierra

 


Hijos de la misma tierra es un relato digital (2026) de Félix Remírez, programado en html5/CSS y javascript.

En remotos tiempos paleolíticos, la obra narra el encuentro entre un sapiens, Ergu, y un neandertal, Adgor. La lucha por la supervivencia y el bienestar de sus respectivas familias les obliga a colaborar y de la relación que establecen llegan a comprender que los prejuicios que cada especie tiene de la otra no son ciertos. Una relación que, forzosamente, ha de basarse en los instintos y los sentimientos por cuanto no comparten lengua, cultura o historia. Sin embargo, encuentran que los valores en los que creen son similares.

La narración se desarrolla en 7 escenas con 5 textos cada una. En total, 35 fragmentos que conforman, en el orden correcto, la historia de los dos personajes y sus descendientes. El lector debe ir descubriendo cada párrafo con el uso del scroll y adentrase, mediante zooms, en los paisajes que se le presentan.

Contiene una banda sonora basada en música de Stravinsky combinada con sonidos de la naturaleza.

Las imágenes están compuestas parcialmente con ayuda de sistemas de diseño basados en IA.






24/3/26

¿Continuar la literatura humana con IA (I)?

 


¿Podría un LMM reescribir una novela escrita por un humano a partir de sólo las primeras frases?

Los grandes modelos de lenguaje (LMM) son redes neuronales del tipo transformer y, como tales, son sistemas probabilísticos. Es decir, no son buscadores como a veces el público en general piensa que son, no buscan la frase - exacta o similar- entre la ingente cantidad de información en la red para recuperar un resultado ligado a tal información. Ciertamente, los modelos actuales pueden también acceder a Internet pero su funcionamiento sigue siendo, principalmente, probabilístico. Un LLM no "busca" en una base de datos de libros, sino que predice el siguiente token (palabra o parte de ella) más probable basándose en el contexto previo. 

Por tanto, el texto generado que nos devuelve el LLM se crea en ese mismo momento, mediante un conjunto de reglas matemáticas que van infiriendo la palabra siguiente más probable, independientemente de que esa palabra  "calculada"  pertenezca realmente a lo introducido con el texto original. Si la cadena de texto que hemos introducido es muy famosa, seguramente habrá aparecido cientos o miles de veces entres los miles de millones de textos con que se entrena a estos sistemas. En tal caso, la probabilidad de que se genere el texto exacto es muy alta porque hay muchos datos de entrenamiento que ya dan como muy probable esa continuación. Nótese, no obstante que esta comportamiento no depende de que el sistema haya almacenado o busque en Internet dicha continuación, sino de que estaba muchas veces repetida en los datos del entrenamiento y ha otorgado una alta probabilidad a esos textos concretos.

Así, si pedimos. por ejemplo, a ChatGPT que continúe con el inicio de El Quijote:  En un lugar de la Mancha, de cuyo nombre no quiero acordarme, no ha mucho tiempo que vivía un hidalgo de los de lanza en astillero, adarga antigua, rocín flaco y galgo corredor. Una olla de algo más vaca que carnero, salpicón las más noches, duelos y quebrantos los sábados, lantejas los viernes, algún palomino de añadidura los domingos, consumían las tres partes de su hacienda...,  

el sistema nos devuelve la continuación cervantina con exactitud: El resto della se iba en un sayo de velarte, calzas de velludo para las fiestas, con sus pantuflos de lo mismo, y los días de entre semana se honraba con su vellorí de lo más fino. Tenía en su casa una ama que pasaba de los cuarenta, y una sobrina que no llegaba a los veinte, y un mozo de campo y plaza, que así ensillaba el rocín como tomaba la podadera. Frisaba la edad de nuestro hidalgo con los cincuenta años, de complexión recia, seco de carnes, enjuto de rostro y gran madrugador y amigo de la caza. Quieren decir que tenía el sobrenombre de Quijada, o Quesada, que en esto hay alguna diferencia en los autores que deste caso escriben.


Y esto ocurre así porque ese inicio que hemos introducido lo ha visto en su entrenamiento probablemente miles de veces, en diferentes ediciones del Quijote, en artículos que hablen sobre la novela, etc. (un asunto colateral es el de los derechos de autor ya que esas miles de ediciones, miles de documentos y uso de libros de bibliotecas, se ha realizado sin aparente consentimiento).

Técnicamente, en el contexto de los Grandes Modelos de Lenguaje (LLMs) y Modelos Multimodales (LMMs), suele llamarse "temperatura" (aunque nada tenga que ver con el calor) a un parámetro que controla el grado de aleatoriedad y creatividad en las respuestas generadas. Este parámetro matemático del sistema influye en cómo dicho modelo selecciona la siguiente palabra o token en una secuencia.  En el caso de textos muy famosos, como el del ingenioso hidalgo, y por ello muy repetidos en los libros y documentos existentes en el planeta, el modelo ha visto esta secuencia miles de veces y la probabilidad de que la palabra "lugar" siga a "un" en ese contexto es casi del 100%. En tal caso, se define un factor "temperatura" muy bajo, incluso cero, el modelo se comporta determinísticamente y genera exactamente la continuación real porque tales frases tienen una probabilidad muy grande de ser las siguientes por cuanto que se han repetido muchas veces anteriormente en el entrenamiento.

En realidad, nuestros cerebros también funcionan así. Si yo he visto repetidamente, desde que aprendí a leer, la frase "En un lugar de la Mancha, de cuyo nombre no quiero acordarme", cuando me pregunten ¿Cómo crees que continúa la frase "En un lugar de Mancha...", es más que probable, prácticamente seguro, que contestaré "...de cuyo nombre no quiero acordarme". Pero si me preguntan, como continuaría la frase "Una mañana de enero...", no recordaré ninguna frase concreta y, por el contrario, tendré cientos de repuestas más o menos igual de plausibles como "el frío intenso se colaba por las ventanas". o "vi llegar a don Manuel, con abrigo grueso, bufanda y sombrero calado", u "ocurrió lo inesperado, eso que acontece tras una navidad placentera...".

Para verificar este hecho, probemos con una frase de inicio de El árbol de la ciencia, de Pío Baroja, una obra muchísimo menos conocida que El Quijote. En este caso, la frase que abre la novela es: 

En el patio de la Escuela de Arquitectura, grupos de estudiantes esperaban a que se abriera la clase. De la puerta de la calle de los Estudios que daba a este patio, iban entrando muchachos jóvenes que, al encontrarse reunidos, se saludaban, reían y hablaban. 

que continúa, en la realidad, con:

Por una de estas anomalías clásicas de España, aquellos estudiantes que esperaban en el patio de la Escuela de Arquitectura no eran arquitectos del porvenir, sino futuros médicos y farmacéuticos. La clase de química general del año preparatorio de medicina y farmacia se daba en esta época en una antigua capilla del Instituto de San Isidro convertida en clase, y éste tenía su entrada por la Escuela de Arquitectura. 

Sin embargo, ahora, Gemini nos devuelve este resultado: 

El sol de otoño, todavía tibio, se filtraba entre las columnas del patio, dibujando sombras alargadas sobre las carpetas de dibujo y los tubos de planos que colgaban de los hombros de los recién llegados. El aire olía a una mezcla nostálgica de papel húmedo, tinta china y el café apresurado de los puestos cercanos. Entre el murmullo general, destacaba la figura de un estudiante de último curso que, subido a un peldaño de la escalinata, gesticulaba con vehemencia mientras explicaba la última corrección de un profesor de Proyectos. Un pequeño círculo de oyentes asentía con esa mezcla de resignación y entusiasmo que define a quien ha pasado la noche en vela frente a un tablero.




y es que el libro de Baroja no se habrá repetido en los datos de entrenamiento de modo que la "temperatura" será alta. Habrá muchas palabras, muchas frases de continuación igualmente posibles, ninguno de los datos de entrenamiento se habrá repetido un significativo número de veces y, por tanto, el LLM generará una respuesta nueva con mayor aleatoriedad. El texto completo de El árbol de la ciencia, se encuentra fácilmente en Internet y si un LLM fuera un buscador, simplemente hubiera encontrado la referencia y hubiera respondido con el texto exacto original. Pero, como dijimos al inicio y repetimos ahora, un modelo de lenguaje no es un buscador, es un generador de palabras probables con las probabilidades calculadas con los miles de millones de textos que se usaron en su entrenamiento.

Hagamos, pues, algunos experimentos para observar cómo diversos LMM continúan textos literarios reales. En este primer capítulo utilizaremos ChatGPT y en próximas entregas usaremos Gemini; Claude y Grok

Partimos de una obra bien conocida pero que ni se acerca a la popularidad del Quijote, por lo que su presencia en los datos de entrenamiento será mucho más baja y permitirá que el LMM deba calcular qué palabras de continuación son más probables que otras.

La obra es Trafalgar, de Los episodios nacionales, de Benito Pérez Galdós.

Comienza así:

Se me permitirá que antes de referir el gran suceso de que fui testigo, diga algunas palabras sobre mi infancia, explicando por qué extraña manera me llevaron los azares de la vida a presenciar la terrible catástrofe de nuestra marina.

Al hablar de mi nacimiento, no imitaré a la mayor parte de los que cuentan hechos de su propia vida, quienes empiezan nombrando su parentela, las más veces noble, siempre hidalga por lo menos, si no se dicen descendientes del mismo Emperador de Trapisonda. Yo, en esta parte, no puedo adornar mi libro con sonoros apellidos; y fuera de mi madre, a quien conocí por poco tiempo, no tengo noticia de ninguno de mis ascendientes, si no es  de Adán, cuyo parentesco me parece indiscutible. Doy principio, pues, a mi historia como Pablos, el buscón de Segovia: afortunadamente Dios ha querido que en esto sólo nos parezcamos.

y la continuación real es:

Yo nací en Cádiz, y en el famoso barrio de la Viña, que no es hoy, ni menos era entonces, academia de buenas costumbres. La memoria no me da luz alguna sobre mi persona y mis acciones en la niñez, sino desde la edad de seis años; y si recuerdo esta fecha, es porque la asocio a un suceso naval de que oí hablar entonces: el combate del cabo de San Vicente, acaecido en 1797.

Dirigiendo una mirada hacia lo que fue, con la curiosidad y el interés propios de quien se observa, imagen confusa y borrosa, en el cuadro de las cosas pasadas, me veo jugando en la Caleta con otros chicos de mi edad poco más o menos. Aquello era para mí la vida entera; más aún, la vida normal de nuestra privilegiada especie; y los que no vivían como yo, me parecían seres excepcionales del humano linaje, pues en mi infantil inocencia y desconocimiento del mundo yo tenía la creencia de que el hombre había sido criado para la mar, habiéndole asignado la Providencia, como supremo ejercicio de su cuerpo, la natación,  y como constante empleo de su espíritu el buscar y coger cangrejos, ya para arrancarles y vender sus estimadas bocas, que llaman de la Isla, ya para propia satisfacción y regalo, mezclando así lo agradable con lo útil.

Pidiendo a ChatGPT que continúe los párrafos iniciales, la respuesta es:

Crecí, pues, sin más amparo que el de mi propia curiosidad y el instinto de conservarme, que en los niños desvalidos suele despertarse más temprano que en aquellos a quienes la fortuna arrulla entre comodidades. Mi niñez transcurrió entre calles estrechas y bulliciosas, donde aprendí antes a observar que a jugar, y donde cada rostro y cada suceso dejaban en mí una impresión duradera. No tuve maestro que me enseñase letras con método, pero sí mil ocasiones que avivaron mi entendimiento y me dieron cierta malicia precoz, hija no tanto de la perversidad como de la necesidad de abrirme camino en un mundo que no se mostraba benigno conmigo.

Fue en aquella vida errante y sin rumbo fijo donde comenzaron a entrelazarse los hilos que, sin yo saberlo entonces, habrían de conducirme al espectáculo más sobrecogedor de mi existencia. Un encuentro casual, una recomendación hecha casi por descuido y el deseo, siempre vivo en mí, de cambiar de suerte, me llevaron a embarcarme en empresas que no eran propias de mi edad ni de mi experiencia. Así, paso a paso y sin preverlo, me vi arrastrado hacia el teatro de grandes acontecimientos, donde la gloria y la desgracia se disputan el destino de los hombres, y donde yo había de presenciar la funesta jornada que ha motivado estas páginas.


Se observa en este caso que la continuación es totalmente diferente a la que imaginó Pérez Galdós. 

Sigamos experimentando. Voy ahora a introducir el texto completo acumulado, juntando el comienzo real de don Benito y la continuación que nos ha creado el LMMs.

Se me permitirá que antes de referir el gran suceso de que fui testigo, diga algunas palabras sobre mi infancia, explicando por qué extraña manera me llevaron los azares de la vida a presenciar la terrible catástrofe de nuestra marina.

Al hablar de mi nacimiento, no imitaré a la mayor parte de los que cuentan hechos de su propia vida, quienes empiezan nombrando su parentela, las más veces noble, siempre hidalga por lo menos, si no se dicen descendientes del mismo Emperador de Trapisonda. Yo, en esta parte, no puedo adornar mi libro con sonoros apellidos; y fuera de mi madre, a quien conocí por poco tiempo, no tengo noticia de ninguno de mis ascendientes, si no es  de Adán, cuyo parentesco me parece indiscutible. Doy principio, pues, a mi historia como Pablos, el buscón de Segovia: afortunadamente Dios ha querido que en esto sólo nos parezcamos.

Crecí, pues, sin más amparo que el de mi propia curiosidad y el instinto de conservarme, que en los niños desvalidos suele despertarse más temprano que en aquellos a quienes la fortuna arrulla entre comodidades. Mi niñez transcurrió entre calles estrechas y bulliciosas, donde aprendí antes a observar que a jugar, y donde cada rostro y cada suceso dejaban en mí una impresión duradera. No tuve maestro que me enseñase letras con método, pero sí mil ocasiones que avivaron mi entendimiento y me dieron cierta malicia precoz, hija no tanto de la perversidad como de la necesidad de abrirme camino en un mundo que no se mostraba benigno conmigo.

Fue en aquella vida errante y sin rumbo fijo donde comenzaron a entrelazarse los hilos que, sin yo saberlo entonces, habrían de conducirme al espectáculo más sobrecogedor de mi existencia. Un encuentro casual, una recomendación hecha casi por descuido y el deseo, siempre vivo en mí, de cambiar de suerte, me llevaron a embarcarme en empresas que no eran propias de mi edad ni de mi experiencia. Así, paso a paso y sin preverlo, me vi arrastrado hacia el teatro de grandes acontecimientos, donde la gloria y la desgracia se disputan el destino de los hombres, y donde yo había de presenciar la funesta jornada que ha motivado estas páginas.

y ahora ChatGPT continúa con:

En ese tránsito, que a mí se me figuraba entonces como una serie de meros accidentes sin concierto ni propósito, iba en realidad obrando una mano invisible que disponía cada paso con una finalidad que sólo más tarde llegaría a comprender. Las personas que conocí en aquellos primeros viajes, los oficios que probé por necesidad y las penurias que sufrí sin tener aún edad para medirlas, fueron templando mi carácter y enseñándome a desconfiar de las apariencias, a escuchar más que a hablar y a guardar para mí mismo los juicios que en el ánimo se me formaban con rapidez. No pocas veces me vi en situaciones en que el menor descuido hubiera bastado para perderme, y fue entonces cuando advertí que la fortuna, aun en sus más duros golpes, deja siempre un resquicio por donde el hombre atento puede salvarse.

Con el tiempo, aquella disposición errante de mi vida me llevó a frecuentar gentes de mar, cuya conversación, sazonada de riesgos, viajes y empresas remotas, encendió en mí un deseo de conocer horizontes más amplios que los que hasta entonces había pisado. No tardé en comprender que el mar, con su apariencia de libertad infinita, es también escuela severa donde se prueba el temple de los hombres y se desnuda su verdadera naturaleza. Así fue como, sin haberlo previsto ni buscado con empeño deliberado, me encontré incorporado a la tripulación que habría de verse envuelta en los acontecimientos cuya memoria aún hoy estremece mi ánimo, y cuya relación emprendo ahora, no sin cierto temblor, por la magnitud de lo que mis ojos llegaron a contemplar.



que ya se aleja definitivamente de la obra original. Galdós continúa en realidad con:

La sociedad en que yo me crié era, pues, de lo más rudo, incipiente y soez que puede imaginarse, hasta tal punto, que los chicos de la Caleta éramos considerados como más canallas que los que ejercían igual industria y desafiaban con igual brío los elementos en Puntales; y por esta diferencia, uno y otro bando nos considerábamos rivales, y a veces medíamos nuestras fuerzas en la Puerta de Tierra con grandes y ruidosas pedreas, que manchaban el suelo de heroica sangre.

Dirigiendo una mirada hacia lo que fue, con la curiosidad y el interés propios de quien se observa, imagen confusa y borrosa, en el cuadro de las cosas pasadas, me veo jugando en la Caleta con otros chicos de mi edad poco más o menos. Aquello era para mí la vida entera; más aún, la vida normal de nuestra privilegiada especie; y los que no vivían como yo, me parecían seres excepcionales del humano linaje, pues en mi infantil inocencia y desconocimiento del mundo yo tenía la creencia de que el hombre había sido criado para la mar, habiéndole asignado la Providencia, como supremo ejercicio de su cuerpo, la natación, —7→ y como constante empleo de su espíritu el buscar y coger cangrejos, ya para arrancarles y vender sus estimadas bocas, que llaman de la Isla, ya para propia satisfacción y regalo, mezclando así lo agradable con lo útil.


Segundo experimento

Ahora, vamos a introducir como primera semilla más párrafos iniciales de Galdós para ver si haciendo más larga la entrada, esta está contenida en los datos de entrenamiento y la probabilidad de generar la continuación verdadera aumenta. O sea:

Se me permitirá que antes de referir el gran suceso de que fui testigo, diga algunas palabras sobre mi infancia, explicando por qué extraña manera me llevaron los azares de la vida a presenciar la terrible catástrofe de nuestra marina.

Al hablar de mi nacimiento, no imitaré a la mayor parte de los que cuentan hechos de su propia vida, quienes empiezan nombrando su parentela, las más veces noble, siempre hidalga por lo menos, si no se dicen descendientes del mismo Emperador de Trapisonda. Yo, en esta parte, no puedo adornar mi libro con sonoros apellidos; y fuera de mi madre, a quien conocí por poco tiempo, no tengo noticia de ninguno de mis ascendientes, si no es  de Adán, cuyo parentesco me parece indiscutible. Doy principio, pues, a mi historia como Pablos, el buscón de Segovia: afortunadamente Dios ha querido que en esto sólo nos parezcamos.

Yo nací en Cádiz, y en el famoso barrio de la Viña, que no es hoy, ni menos era entonces, academia de buenas costumbres. La memoria no me da luz alguna sobre mi persona y mis acciones en la niñez, sino desde la edad de seis años; y si recuerdo esta fecha, es porque la asocio a un suceso naval de que oí hablar entonces: el combate del cabo de San Vicente, acaecido en 1797.

Dirigiendo una mirada hacia lo que fue, con la curiosidad y el interés propios de quien se observa, imagen confusa y borrosa, en el cuadro de las cosas pasadas, me veo jugando en la Caleta con otros chicos de mi edad poco más o menos. Aquello era para mí la vida entera; más aún, la vida normal de nuestra privilegiada especie; y los que no vivían como yo, me parecían seres excepcionales del humano linaje, pues en mi infantil inocencia y desconocimiento del mundo yo tenía la creencia de que el hombre había sido criado para la mar, habiéndole asignado la Providencia, como supremo ejercicio de su cuerpo, la natación,  y como constante empleo de su espíritu el buscar y coger cangrejos, ya para arrancarles y vender sus estimadas bocas, que llaman de la Isla, ya para propia satisfacción y regalo, mezclando así lo agradable con lo útil.


ChatGPT nos devuelve:

No tardó, sin embargo, en venir a turbar aquella feliz ignorancia una serie de impresiones nuevas, vagas al principio y después cada vez más persistentes, que fueron despertando en mi ánimo una inquietud desconocida. Recuerdo que, en ciertas tardes en que el viento traía hasta la playa rumores de voces alteradas y el lejano estampido de cañones, los hombres dejaban sus faenas, y aun los más despreocupados de entre nosotros miraban hacia el horizonte con una gravedad que no era habitual en ellos. Yo, sin comprender la causa de aquella mudanza, sentía, no obstante, que algo extraordinario se preparaba, y que la mar, hasta entonces amiga y juguetona, encerraba misterios que escapaban a mi corta razón.

Fue en una de esas jornadas, en que el cielo aparecía encapotado y el oleaje rompía con inusitada violencia contra las rocas de la Caleta, cuando oí por vez primera pronunciar, con acento de temor y respeto, nombres que más tarde habían de quedar profundamente grabados en mi memoria. Los marineros hablaban en corrillos, gesticulando con viveza, y las mujeres acudían a las puertas con semblante angustiado, como si aguardasen noticias decisivas. Yo me acerqué, movido por esa curiosidad viva que es patrimonio de la niñez, y aunque apenas comprendí el sentido de sus palabras, percibí con claridad que se trataba de un inminente peligro para nuestra escuadra. Aquella impresión, leve en apariencia, fue la primera sombra que se proyectó sobre mi espíritu, anunciándome, sin yo saberlo, la terrible catástrofe de que había de ser testigo años después.

también ajeno al original. 




Tercer experimento

Por último vamos a introducir en el prompt de la pregunta el nombre del autor para ver si esto hace que el LMM use un subconjunto de datos de entrenamiento que recojan precisamente obras de Galdós:

La respuesta de ChatGPT es:

Mas no todo era juego y bullicio en aquella edad temprana, aunque así me lo figurase mi inocente entendimiento. Había, sin yo advertirlo claramente, cierta gravedad en las conversaciones de los mayores, cierto temblor en las voces que hablaban de la mar, como si en su inmensidad no sólo cupieran peces y tesoros, sino también infortunios y desdichas. Muchas veces, mientras nosotros perseguíamos cangrejos entre las peñas, veíamos a los hombres mirar al horizonte con ojos inquietos, o a las mujeres detenerse en sus faenas para escuchar noticias que traían los marineros recién llegados. Yo no alcanzaba entonces a comprender el sentido de aquellas preocupaciones; pero quedaron en mi ánimo como una sombra leve, anuncio quizá de las impresiones más hondas que después habían de conmover mi vida.

Fue también por aquellos días cuando empecé a distinguir entre los distintos semblantes que ofrecía la mar, ya plácida y risueña como compañera de nuestros juegos, ya sombría y terrible cuando el viento la agitaba y ennegrecía su superficie. Recuerdo que, en una ocasión, una borrasca repentina nos obligó a huir de la playa, y vi cómo las olas, embravecidas, azotaban con furia las rocas donde poco antes reinaba nuestra alegre algazara. Aquella transformación súbita me produjo una impresión tan viva, que desde entonces comencé a mirar el mar con respeto, si no con temor; y acaso en aquel sentimiento naciente se hallaba el germen de la atención con que más tarde habría de contemplar los grandes sucesos que en él tuvieron por teatro su desarrollo.



totalmente distinta a la continuación original, lo que implica que el dato de que el escritor es Pérez Galdós no aporta nada al cálculo probabilístico.

En próximas entradas repetiremos el experimento con otros LMMs.

Personalmente, creo que el lo escrito por Galdós es de mayor calidad que lo escrito por ChatGPT pero me gustaría conocer las opiniones de los lectores.










22/3/26

Encuentro sobre experiencias literarias expandidas

 


Mañana y pasado mañana se celebra en la Universidad de Málaga, el I encuentro sobre experiencias literarias expandidas: crear, enseñar y difundir en la era de la IA. 

El evento será por la tarde del lunes y la mañana de martes.

El programa es el siguiente:

- "No bajar la guardia: la literatura en las aulas universitarias", por Francisca Noguerol

- "La literatura española y las redes sociales", por Daniele Crivellari.

- Coloquio "Enseñar literatura en la era del smartphone"

- Coloquio "IA en las humanidades", con Antonio Diéguez y Vicente L. Mora

- "Una dialogante lucha de clases", por Gaspar Garrote.




meghadutam

 


meghadutam, de Priti Pandurangan, es una obra del año 2019 que se adentra en las llamada literatura digital cinética y net-art para, precisamente, animar el texto que aparece en pantalla.

meghadutam es un poema épico de amor escrito en sánscrito. 

Primero, las frases se desarrollan sobre el fondo mientras se escucha simultáneamente su transcripción verbal. Una vez finalizada la animación, el usuario puede interactuar con las palabras moviéndolas en todas las direcciones y ejecutando ampliaciones o reducciones con las flechas del teclado. Narrado en seis partes, su poema visual gira en patrones circulares en la pantalla, como la nube enviada por el espíritu de la naturaleza para entregar un mensaje a su amor lejano.  

Puede leerse desde este enlace.