Biblumliteraria LITERATURA ELECTRÓNICA Y DIGITAL BIBLUMLITERARIA

26/7/24

Codificado hojas de cálculo para que sean manejables por los modelos de lenguaje

Investigadores de Microsoft, encabezados por Yuzhang Tian, han publicado un artículo técnico en el que desarrollan métodos para poder codificar hojas de cálculo de modo que la información que contienen sea manejable por los grandes modelos de lenguaje (LLM). El método propuesto se denomina SpreadSheetLLM.

Como bien se sabe, una hoja de cálculo se define, sobre todo, por una matriz de dos dimensiones que organiza datos (números, textos, etc) en una rejilla cuadriculada de filas y columnas, con relaciones entre ellas determinadas por fórmulas o asignaciones. Se trata de aplicaciones muy flexibles en las que los datos pueden encontrarse en muchos y diversos formatos, algo que supone un desafío importante para los LLM a la hora de interpretar qué tipo de información es y cómo se relaciona con la otra información.

En concreto, son cuatro los problemas que las redes neuronales de lenguaje encuentran con las hojas de cálculo: primero, la ya citada de los formatos variables que contienen. Segundo, el que la estructura bidimensional de las hojas de cálculo casa mal con la secuenciación lineal de los datos en una red. Tercero, que la información contenida en una hoja de cálculo de tamaño medio sobrepasa la capacidad de tokens de una LLM habitual. Nótese que una hoja de 500 x 500 filas y columnas, nada extraordinario, contiene ya 250.000 casillas que pueden contener frases, ocupando en total muchos millones de tokens. Y, cuarto, que la maraña interna de conexiones entre las celdas de la hoja, que tiene características recursivas, es de difícil implementación en una red neuronal.

SpreadSheetLMM una un sistema de codificación llamado SheetCompressor que consta de tres módulos: uno de compresión de datos basada en anclajes estructurales, otro de traducción inversa de índices y, finalmente, un tercero de agregación de datos en función del formato. Las pruebas realizadas señalan una mejora de hasta el 25% en el aprendizaje de GPT4 cuando las hojas de cálculo son utilizadas como fuente de entrada de información.

Los investigadores han observado que las grandes hojas de cálculo contienen numerosas celdas homogéneas cercanas entre ellas, de modo que se tienen, dentro de la hoja, como islas de celdas relacionadas. Dentro de cada "isla", hay muchas relaciones pero cada "isla" tiene poco que ver con otras islas alejadas en la hoja. Por ello, han creado un algoritmo que identifica las relaciones estructurales -filas y columnas heterogéneas y columnas heterogéneas cercanas - para distinguirlas de otros grupos relacionados más alejados que pueden ser borrados admitiendo que no tendrán que ver con el subconjunto que estábamos tratando. De este modo se logra crear un esqueleto simplificado de la hoja de cálculo.

Asimismo, para reducir el uso de tokens, se desestima la típica creación de un vector lineal con todos los datos de las filas y columnas para sustituirlo por una codificación JSON. Esta codificación crea un diccionario en el que celdas con información igual quedan cifradas por un único dato del diccionario. Esto me recuerda, un poco, a la codificación usada en un gráfico GIF.

Por último, el análisis de la realidad habitual señala que celdas cercanas contienen, en general, datos con formato similar lo que permite una adicional compresión y reducción de las variables necesarias.

Los experimentos realizados muestran que SheetCompressor logra reducir el uso de tokens en un 96%, un avance muy significativo.

Para facilitar la "comprensión" de los datos de la hoja, los investigadores proponen una nueva codificación basada en el sistema Markdown.

La explicación completa y parte del desarrollo matemático inherente a este nuevo método pueden verse en el artículo completo, en este enlace.

24/7/24

Corrección ortográfica con ChatGPT

Los correctores ortográficos están, hoy en día, ampliamente desarrollados y funcionan razonablemente bien, embebidos en procesadores de textos, navegadores, aplicaciones ofimáticas o teléfonos móviles.

No obstante, conocemos bien sus limitaciones que se concentran sobre todo en palabras que se escuchan igual pero que se escriben diferentemente porque llevan una tilde, porque llevan "b" o "v", etc. Especialmente, aquellas que se diferencian sólo en una tilde son generalmente obviadas por el corrector puesto que para el algoritmo, la palabra existe también.

Por ejemplo, en la frase "ayer el hombre empujó la silla", si "empujó" no lleva acento, muchos correctores no reconocerán el error ya que "empujo" ("Yo empujo") está también en sus diccionarios.

ChatGPT puede ser usado para hacer revisiones ortográficas. Para probarlo, he tomado un pequeño fragmento del célebre cuento de Bécquer, "El miserere". El fragmento original es:

Consecuente con mi manía, repasé los cuadernos, y lo primero que me llamó la atención fue que, aunque en la última página había esta palabra latina, tan vulgar en todas las obras, finis, la verdad era que el Miserere no estaba terminado, porque la música no alcanzaba sino hasta el décimo versículo.

Esto fue sin duda lo que me llamó la atención primeramente; pero luego que me fijé un poco en las hojas de música, me chocó más aún el observar que en vez de esas palabras italianas que ponen en todas, como maestoso, allegro, ritardando, piú vivo, a piacere, había unos renglones escritos con letra muy menuda y en alemán, de los cuales algunos servían para advertir cosas tan difíciles de hacer como esto: Crujen… crujen los huesos, y de sus médulas han de parecer que salen los alaridos; o esta otra: La cuerda aúlla sin discordar, el metal atruena sin ensordecer; por eso suena todo, y no se confunde nada, y todo es la Humanidad que solloza y gime; o la más original de todas, sin duda, recomendaba al pie del último versículo: Las notas son huesos cubiertos de carne; lumbre inextinguible, los cielos y su armonía… ¡fuerza!… fuerza y dulzura.

-¿Sabéis qué es esto? -pregunté a un viejecito que me acompañaba, al acabar de medio traducir estos renglones, que parecían frases escritas por un loco.

El anciano me contó entonces la leyenda que voy a referiros.

Hace ya muchos años, en una noche lluviosa y oscura, llegó a la puerta claustral de esta abadía un romero, y pidió un poco de lumbre para secar sus ropas, un pedazo de pan con que satisfacer su hambre, y un albergue cualquiera donde esperar la mañana y proseguir con la luz del sol su camino.

Su modesta colación, su pobre lecho y su encendido hogar, puso el hermano a quien se hizo esta demanda a disposición del caminante, al cual, después que se hubo repuesto de su cansancio, interrogó acerca del objeto de su romería y del punto a que se encaminaba.

-Yo soy músico -respondió el interpelado-, he nacido muy lejos de aquí, y en mi patria gocé un día de gran renombre. En mi juventud hice de mi arte un arma poderosa de seducción, y encendí con él pasiones que me arrastraron a un crimen. En mi vejez quiero convertir al bien las facultades que he empleado para el mal, redimiéndome por donde mismo pude condenarme.

Y lo he alterado, eliminado muchas tildes, cambiando bes por uves, añadiendo o quitando haches, ges por jotas, etc. de este modo:

Consecuente con mi mania, repase los kuadernos, y lo primero que me llamo la atencion fue que, haunque en la ultima pagina abía esta palabra latina, tan bulgar en todas las obras, finis, la berdad era que el Miserere no estaba terminado, porque la música no alcanzaba sino hasta el decimo bersiculo.

Esto fue sin duda lo que me llamo la atencion primeramente; pero luego que me fije un poco en las hojas de músika, me choco mas aun el observar que en vez de esas palabras hitalianas que ponen en todas, como maestoso, allegro, ritardando, piú vivo, a piacere, había unos renglones excritos con letra muy menuda y en aleman, de los cuales alunos servían para advertir cosas tan difíciles de hacer como esto: Crujen… crujen los huesos, y de sus médulas han de parecer que salen los halaridos; o esta otra: La cuerda aulla sin discordar, el metal atruena sin ensordecer; por eso suena todo, y no se confunde nada, y todo es la Umanidad que solloza y jime; o la más original de todas, sin duda, recomendaba al pie del ultimo versículo: Las notas son huesos cubiertos de carne; lumbre inestingible, los cielos y su armonía… ¡fuerza!… fuerza y dulsura.

-¿Sabéis qué es ezto? -pregunte a un viejesito que me acompañaba, al acabar de medio traducir estos renglones, que parecian frases escritas por un loco.

El anciano me conto entonces la leyenda que voy a referiros.

Ace ya muchos años, en una noche lluviosa y oscura, llegó a la puerta claustral de esta avadía un romero, y pidió un poco de lumbre para secar sus ropas, un pedaso de pan con que satisfacer su ambre, y un alberge cualquiera donde esperar la mañana y proseguir con la luz del sol su camino.

Su modesta colación, su pobre lecho y su encendido ogar, puso el hermano a quien se hizo esta demanda a disposición del caminante, al cual, después que se ubo repuesto de su cansancio, interrogó acerca del obgeto de su romería y del punto a que se encaminaba.

-Yo soy músico -respondió el interpelado-, e nasido muy lejos de aquí, y en mi patria gozé un día de gran renombre. En mi juventud hice de mi arte un arma poderosa de sedución, y encendí con el pasiones que me arrastraron a un crimen. En mi vejez quiero conbertir al bien las facultades que he empleado para el mal, redimiéndome por donde mismo pude condenarme.

Dado este texto a ChatGPT y solicitando que detecte, señale y corrija lo que esté mal, este es el resultado:

Aquí están las correcciones y las faltas de ortografía señaladas:

mania → manía

repase → repasé

kuadernos → cuadernos

llamo → llamó

atencion → atención

haunque → aunque

ultima → última

abía → había

bulgar → vulgar

berdad → verdad

decimo → décimo

bersiculo → versículo

llamo → llamó

atencion → atención

fije → fijé

músika → música

choco → chocó

mas → más

hitalianas → italianas

excritos → escritos

aleman → alemán

alunos → algunos

halaridos → alaridos

aulla → aúlla

Umanidad → Humanidad

jime → gime

ultimo → último

inestingible → inextinguible

dulsura → dulzura

ezto → esto

pregunte → pregunté

viejesito → viejecito

parecian → parecían

conto → contó

Ace → Hace

avadía → abadía

pedaso → pedazo

ambre → hambre

alberge → albergue

ogar → hogar

ubo → hubo

obgeto → objeto

e nasido → he nacido

sedución → seducción

el → él

conbertir → convertir

Texto corregido:

Consecuente con mi manía, repasé los cuadernos, y lo primero que me llamó la atención fue que, aunque en la última página había esta palabra latina, tan vulgar en todas las obras, "finis", la verdad era que el Miserere no estaba terminado, porque la música no alcanzaba sino hasta el décimo versículo.

Esto fue sin duda lo que me llamó la atención primeramente; pero luego que me fijé un poco en las hojas de música, me chocó más aún el observar que en vez de esas palabras italianas que ponen en todas, como maestoso, allegro, ritardando, più vivo, a piacere, había unos renglones escritos con letra muy menuda y en alemán, de los cuales algunos servían para advertir cosas tan difíciles de hacer como esto: "Crujen… crujen los huesos, y de sus médulas han de parecer que salen los alaridos"; o esta otra: "La cuerda aúlla sin discordar, el metal atruena sin ensordecer; por eso suena todo, y no se confunde nada, y todo es la Humanidad que solloza y gime"; o la más original de todas, sin duda, recomendaba al pie del último versículo: "Las notas son huesos cubiertos de carne; lumbre inextinguible, los cielos y su armonía… ¡fuerza!… fuerza y dulzura."

-¿Sabéis qué es esto? -pregunté a un viejecito que me acompañaba, al acabar de medio traducir estos renglones, que parecían frases escritas por un loco.

El anciano me contó entonces la leyenda que voy a referiros.

El resultado es muy bueno, e incluso corrige fallos como "él" por "el", que un corrector típico no detectaría. O "llamó" por "llamo", que el propio corrector de Blogger, al crear esta entrada, no ha reconocido. Lo mismo cabe decir de "fijé" y "fije" que el editor de Blogger tampoco ha reconocido al editar la entrada, pero ChatGPT, sí. O, "más" y "mas", etc.

Igualmente, para un corrector habitual, las palabras en italiano propias de la terminología musical se marcan como incorrectas mientras que ChatGPT las reconoce como válidas en el contexto.

Un buen trabajo corrector de ChatGPT.

21/7/24

Navarra y su románico

Se trata de un portal sobre los monumentos y lugares románicos en Navarra. Se presentan sobre un mapa geolocalizado en el que es posible ampliar una zona para localizar elementos con detalle. Una vez seleccionado uno de ellos, se muestran en un lateral sus coordenadas geográficas, en algunos casos una fotografía, y en todos ellos multitud de enlaces de calidad sobre el lugar o edificio seleccionado, tanto a nivel histórico, como geográfico, turístico o artístico.

En este momento, tiene memorizados 225 fichas de información.

Un problema que tiene es que, entre todos esos enlaces que llevan a información adicional, hay bastantes enlaces rotos que ya no existen.

Puede verse desde este enlace.

20/7/24

Liber Rotavi

Liber Rotavi, del mexicano Diego Bonilla y Jesús del Toro, es una obra de poesía interactiva. Consta de 35 sonetos, divididos en 4 secciones: “Creación”, “Destrucción”, “Tesoro” y “Ella”.

La generación de la visualización sobre estos versos es generada por el programa y es notable la gran cantidad de recursos que se han utilizado. Más de 13.000 imágenes y 120 archivos sonoros. Con tal variedad de elementos, la originalidad de cada visualización está garantizada, ya que las posibles combinaciones alcanzan una cantidad monumental.

Los textos están sometidos a transformaciones cinemáticas, las imágenes orbitan y se mueven en la pantalla y los colores cambian, todo ello junto al sonido, en cada pantalla.

Además, y esto es original, la forma en que se presentan los sonetos varía según el momento del día (para ello, el algoritmo controla el reloj del ordenador), de modo que puede verse de una manera clara y descansada a la mañana pero confusa a la noche, cuando el lector está ya cansado.

Puede descargarse desde este enlace. Ocupa más de 600 megas. Para su funcionamiento, se requiere Quicktime.

18/7/24

ELO 2024

Como ya se avisó en su momento en este Blog, hoy comienza en Florida la edición 2024 de la ELO, Electronic Literature Organization.

En los 3 días que durará el Congreso, y como suele ser habitual, se impartirán charlas sobre literatura digital, habrá talleres y experiencias de literatura electrónica, mesas redondas y paneles expositivos.

El programa completo, realmente interesante, puede verse en este enlace.

17/7/24

Sintetización de voz directamente desde las señales cerebrales

Debido a accidentes o problemas neurológicos, algunas personas pierden la capacidad de hablar. Esto no significa que dejen de ser capaces de crear una conversación en su cerebro sino que no pueden transmitir las señales necesarias para activar sus cuerdas vocales.

Un grupo de investigadores, liderados por Miguel Angrick de la Johns Hopkins University School of Medicine, en Baltimore, han desarrollado un implante cerebral capaz de detectar la actividad neuronal del cerebro durante una conversación y, mediante redes neuronales, interpretar qué quiere decir la persona para poder generar por síntesis electrónica la palabra.

Las interfaces cerebro-ordenador (BCI, Brain Computer Interface, en su terminología inglesa) han estado desarrollándose durante ya bastante tiempo y, poco a poco, van logrando éxitos impensables hace una década.

El estudio publicado se centra en el implante realizado a un paciente que sufría de esclerosis. Las señales, en este caso, se toman de las cortezas premotor, motor y somatosensorial de la persona. El experimento es modesto en el sentido de que distingue únicamente entre 6 palabras con las que se ha entrenado a la red neuronal pero, aún así, supone un importante avance para el paciente y demuestra que la comunicación es posible con un muy alto acierto en el descifrado de las señales eléctricas recibidas en el electroencefalógrafo y su sintetizado posterior en habla inteligible.

Sin sistemas de este tipo, en muchos pacientes, la única comunicación posible es mostrar secuencialmente a la persona palabras y que esta pueda aceptar una de ellas mediante un parpadeo de sus ojos, tarea lenta y frustrante.

Adicionalmente, el nuevo sistema permite una generación que simula razonablemente la voz original y que es capaz de producir vocablos al ritmo en que se piensan, sin retardos significativos. En el experimento, y dado que el paciente aún podía generar sonidos, se ha preferido generar la respuesta con un retardo.

Se han usado tres redes neuronales recurrentes (RNNs) para, primero, identificar y amortiguar la actividad neuronal relacionada con el habla; segundo, transformar las secuencias de actividad neuronal relacionadas con el habla en una representación acústica intermedia, y finalmente generar la forma de onda acústica utilizando un sintetizador. Las señales se toman del cerebro mediante dos redes de finos electrodos aplicados en él.

En las pruebas se ha confirmado que el sistema es capaz de interpretar señales u generar voz sintetizada en un lapso de 253 milisegundos lo que abre la puerta a una comunicación casi on-time en el futuro.

Para entrenar las redes neuronales se colaboró con 21 hablantes ingleses que grabaron diferentes formas de pronunciar las palabras y, por tanto, distintos electrogramas.

Curiosamente, aparecieron problemas para discernir la palabra "back" (atrás) que fue confundida en muchas ocasiones con la palabra "left" (izquierda), sin que exista un explicación clara aunque puede ser que una única vocal de cada palabra rodeada por 3 consonantes genere espectros sonoros similares difíciles de diferenciar por las redes neuronales.

El artículo completo, con todos los detalles científicos, puede leerse en este enlace.

16/7/24

ChatGPT traduciendo textos: no tan buenos resultados pero muy razonables (2)

Hace unos días mostrábamos que ChatGPT ofrecía resultados muy buenos a la hora de traducir textos de algunos idiomas al español. Véase esta entrada de Biblumliteraria.

Ahora bien, ¿esa calidad de traducción se da también con lenguas muertas? No es un experimento puramente teórico sino que tiene su importancia ya que una buena calidad de proceso tendría efectos significativos sobre el análisis de textos clásicos que podrían ser traducidos, con seguridad, de manera rápida. Esto agilizaría los trabajos de filología y de estudio de la literatura.

Para verlo, hemos hecho pruebas con textos en latín.

Tomamos, primeramente, un pequeño fragmento del historiador Flavio Eutropio.

Usuario: traduce al español el siguiente texto en latín: Inde Caesar, bellis civilibus toto orbe confectis, Romam rediit et agere insolentius coepit: cum ergo et honores ex sua voluntate praestaret qui a populo ante deferebantur, nec senatui ad eum venienti assurgeret, aliaque regia ac pene tyrannica faceret, coniuratum est in eum a sexaginta vel amplius senatoribus equitibusque Romanis. Praecipui fuerunt inter coniuratos duo Bruti, ex eo genere Bruti qui primus Romae consul factus est et reges expulerat, C. Casius et Servilius Casca. Ergo Caesar, cum senatus die quadam inter caeteros venisset ad curiam, tribus et viginti vulneribus confossus est.

La respuesta de ChatGPT es:

Inde César, después de haber terminado las guerras civiles en todo el mundo, regresó a Roma y comenzó a actuar con más insolencia: así, como otorgaba honores según su voluntad, que antes eran concedidos por el pueblo, y no se levantaba cuando el Senado venía a él, y hacía otras cosas propias de un rey y casi de un tirano, se conspiró contra él por sesenta o más senadores y caballeros romanos. Los principales entre los conspiradores fueron dos Brutos, de la familia de aquel Bruto que fue el primer cónsul de Roma y había expulsado a los reyes, C. Casio y Servilio Casca. Entonces César, cuando un día llegó al Senado entre los demás, fue apuñalado con veintitrés heridas. (Eutropio)

No es una traducción muy correcta (aunque perfectamente inteligible), empezando por ese "inde César". Siendo más precisa, debería ser:

Luego César, después de terminar con todas las guerras civiles por todo el mundo, regresó a Roma y comenzó a obrar de un modo baste insolente: en consecuencia, como otorgaba, según su voluntad. los honores que antes sólo concedía el pueblo, y no se levantaba cuando los senadores acudían hasta él y tenía actuaciones propias de un rey y casi de un tirano, fue objeto de un complot por parte de sesenta o más senadores y caballeros romanos. Entre los conjurados los cabecillas fueron dos Brutos, pertenecientes a la familia de aquel Bruto que se convirtió en el primer rey de Roma y que había expulsado a los reyes, C. Casio y Servilio Casca. Por tanto César, habiendo llegado a la curia un día en que se reunía el Senado, recibió más de veinte y tres heridas.

o, aún más refinada, esta otra:

Después de terminar en el mundo entero con las guerras civiles, volvió César a Roma, donde comenzó a obrar con orgullo y contra las costumbres de la libertad romana. Distribuyó a capricho los honores otorgados hasta entonces por el pueblo; no se levantaba cuando se le acercaba el senado, afectando en otras muchas cosas los ademanes de un rey y casi de un tirano. Por esta razón conspiraron contra él más de sesenta senadores y caballeros romanos. Los dos Brutos, descendientes del primer cónsul de Roma que expulsó a los reyes, eran jefes de aquella trama con Gayo Casio y Servilio Casca. Habiendo acudido César en un día de asamblea a la sala del senado, entre los demás senadores, le mataron dándole veintitrés puñaladas.

Hagamos, la prueba al revés. Introduzcamos el texto correcto en español y veamos cuál es el resultado de la traducción del sistema al latín:

Usuario: el siguiente texto en español hay que traducirlo al latín: Luego César, después de terminar con todas las guerras civiles por todo el mundo, regresó a Roma y comenzó a obrar de un modo baste insolente: por tanto, como otorgaba según su voluntad los honores que antes concedía el pueblo, y no se levantaba cuando los senadores acudían hasta él y tenía actuaciones propias de un rey y casi de un tirano, fue objeto de un complot por parte de sesenta o más senadores y caballeros romanos. Entre los conjurados los cabecillas fueron dos Brutos, pertenecientes a la familia de aquel Bruto que se convirtió en el primer rey de Roma y que había expulsado a los reyes, C. Casio y Servilio Casca. Por tanto César, habiendo llegado a la curia un día en que se reunía el Senado, recibió más de veinte y tres heridas.

siendo el resultado de ChatGPT el siguiente:

Postea Caesar, omnibus bellis civilibus per totum orbem confectis, Romam rediit et insolentius agere coepit: itaque, cum honores pro sua voluntate dare coepisset quos antea populus dabat, et non surgeret cum senatores ad eum venirent et res regias et paene tyrannicas ageret, coniuratione factus est a sexaginta vel pluribus senatoribus et equitibus Romanis. Inter coniuratos duces erant duo Bruti, ex familia illius Bruti qui primus rex Romae factus erat et qui reges expulerat, C. Cassius et Servilius Casca. Itaque Caesar, cum ad Curiam venisset die quo senatus conveniebat, plura quam viginti et tres vulnera accepit.

Que dista sensiblemente del original.

Hagamos las mismas pruebas con otro texto, en este caso un relato de viajes fantásticos de un monje irlandés del siglo VIII (tomado de aquí.)

Usuario: Traduce al español este texto en latín: Sanctus vero Brendanus sciebat qualis erat illa insula sed tamen noluit illis indicare ne fuissent perterriti. (…) Cum ergo et ipse sanctus Brendanus in navi missam cantasset, coeperunt fratres crudas carnes portare foras de navi ut condidissent sale et etiam pisces quos secum tulerunt de alia insula. Cum haec fecissent, posuerunt caccabum super ignem. Cum autem ministrassent lignis ignem et fervere cepisset cacabus, coepit illa insula se movere sicut unda. Fratres vero ceperunt currere ad navim deprecantes patrocinium sancti patris.

At ille singulos per manus trahebat intus. Relictisque omnibus quae portabant in illa insula coeperunt navigare. Porro illa insula ferebatur in oceanum. Tunc poterant videre ignem ardentem super duo miliaria. (…) Sanctus Brendanus narravit fratribus quid hoc esset, dicens: “Filioli mei nolite expavescere. Deus enim revelavit mihi hac nocte per visionem sacramentum huius rei. Insula non est ubi fuimus, sed piscis, prior omnium natantium in Oceano. Quaerit Semper, suam caudam ut simul iungat capiti et non potest pro longitudine. Quam habet nomen Iasconius”.

siendo el resultado:

San Bruno sabía bien qué clase de isla era aquella, pero no quiso indicárselo a los demás para que no se asustaran. (…) Así, cuando el propio San Brendan cantó la misa en el barco, los hermanos comenzaron a sacar carne cruda del barco para salarla, y también los peces que trajeron de otra isla. Cuando hicieron esto, pusieron una olla sobre el fuego. Pero, cuando encendieron el fuego con leña y la olla comenzó a hervir, la isla empezó a moverse como una ola. Los hermanos corrieron hacia el barco implorando la protección del santo padre.

Pero él los agarraba uno por uno de las manos y los subía a bordo. Dejando atrás todo lo que llevaban en la isla, comenzaron a navegar. Mientras tanto, la isla era llevada por el océano. Entonces pudieron ver el fuego ardiendo a más de dos millas. (…) San Brendan contó a los hermanos lo que sucedía, diciendo: "Hijitos míos, no tengan miedo. Dios me ha revelado esta noche en una visión el misterio de este asunto. No era una isla donde estuvimos, sino un pez, el más grande de todos los que nadan en el océano. Siempre intenta juntar su cola con su cabeza, pero no puede por su longitud. Su nombre es Jasconius".

que está bastante bien, aunque una traducción humana más pulida sería:

Bien sabía San Brendán qué tipo de isla era aquella, pero no quiso decírselo a los hermanos para que no se aterrorizasen. (…) Después de que el propio San Brendán hubiera cantado misa en la nave, los hermanos comenzaron a sacar de la nave carnes crudas para ponerlas en salazón y también pescado que trajeron de otra isla. Tras haber hecho esto, pusieron una olla al fuego. Habiendo añadido leña al fuego, cuando la olla empezó a hervir, comenzó la isla a moverse como una ola. Los hermanos empezaron a correr entonces hacia el barco, invocando la protección del santo padre.

Este tomaba a cada uno de la mano y lo subía a bordo. Abandonadas en la isla todas las cosas que traían, retomaron la navegación. Después la isla se movía en el océano. Desde más de dos millas de distancia pudieron ver aún arder el fuego. […] San Brendán les contó a sus hermanos qué era esto, diciendo: “Hijos míos, no temáis. Esta noche pasada Dios me reveló mediante una visión el misterio de este hecho. No es una isla donde estuvimos, sino un pez, el mayor de todos los que viven en el océano. Siempre trata de juntar su cabeza con la cola, y no puede por su tamaño. Se llama Jasconio”.

14/7/24

Diagramas de una ciencia rara

Diagramas de una ciencia rara, de David Medina, es un generador automático de fotolibros. Para ello, con cada click, el programa toma una imagen de un banco de fotografías del Bogotá de 1980. A estas fotografías les añade textos aleatorios seleccionados de libros que se vendían por aquella época en la misma calle, concretamente la Carrera Séptima. Para dar más realismo al álbum, se añaden títulos y un número de código a cada página.

Las combinaciones posibles son virtualmente infinitas y disparan la imaginación del lector, así como potenciales recuerdos de la época.

Durante la visualización, se añaden ruidos callejeros y conversaciones, con lo que se logra sumergir al usuario en la Carrera Séptima.

Puede verse desde este enlace.

13/7/24

World History Atlas

El World History Atlas, de la TimeMap.org, es un atlas interactivo del globo en el que podemos elegir el año a explorar y, una vez realizada esta acción, nos muestra batallas, gobernantes, celebridades o regiones significativas en la fecha seleccionada.

En muchos de los elementos mostrados puede "clikarse" para que se abra una pantalla adicional con más información, generalmente de la Wikipedia. En ocasiones, se muestran asimismo mapas antiguos.

Se trata de un proyecto colaborativo en construcción por lo que los usuarios van añadiendo información, siendo el mapa cada vez más completo. De hecho, ya hay muchísima información histórica memorizada.

Para desplazarse por el mapa se pueden usar el ratón o las flechas de dirección, y es posible hacer zoom en un lugar. Al hacerlo, aparece más información aún.

Puede utilizarse desde este enlace.

10/7/24

ChatGPT traduciendo textos: buenos resultados (1)

Los sistemas de traducción entre idiomas están ya muy desarrollados. No sólo Google Translate sino el muy popular, y muy bueno, Deepl.

Ahora mismo, también, ChatGPT y los demás LLM son otra alternativa más que razonable para traducir idiomas, espacialmente cuando uno de ellos es el inglés.

Pueden verse, a continuación, varias pruebas realizadas con ChatGPT.

1.-Del inglés al español:

1.1..- Texto en inglés (tomado de The Ballad of Geeshie and Elvie - The New York Times (nytimes.com) )

In the ’50s McKune would become a sort of salon master to the so-called Blues Mafia, the initial cell of mainly Northeastern 78-pursuers who evolved, some of them, into the label owners and managers and taste-arbiters of the folk-blues revival. An all-white men’s club, several of whom were or grew wealthy, the Blues Mafia doesn’t always come off heroically in recent — and vital — revisionist histories of the field, more of them being written by women (including two forthcoming books by Daphne Brooks and Amanda Petrusich). Still, no one who seriously cares about the music would pretend that the cultural debt we owe the Blues Mafia isn’t past accounting. It’s not just all they found and documented that marks their contribution. It’s equally what they spawned, whether they would claim it or not. Dylan didn’t listen to 78s, after all, on the floors of those pads he was crashing at in Greenwich Village, but to the early reissue LPs. By Dylan I mean the ’60s. But also Dylan. “If I hadn’t heard the Robert Johnson record when I did,” he wrote 10 years ago, “there probably would have been hundreds of lines of mine that would have been shut down.”

Resultado:

En los años 50, McKune se convertiría en una especie de maestro de salón para la llamada Blues Mafia, el núcleo inicial de buscadores de discos de 78 rpm, principalmente del noreste, quienes evolucionaron, algunos de ellos, en propietarios y gerentes de sellos discográficos y árbitros del gusto del renacimiento del folk-blues. Un club exclusivamente de hombres blancos, varios de los cuales eran o se volvieron ricos, la Blues Mafia no siempre aparece heroicamente en las historias recientes — y vitales — revisionistas del campo, más de las cuales están siendo escritas por mujeres (incluidos dos libros próximos de Daphne Brooks y Amanda Petrusich). Aún así, nadie que realmente se preocupe por la música fingiría que la deuda cultural que le debemos a la Blues Mafia no está más allá de toda medida. No es solo todo lo que encontraron y documentaron lo que marca su contribución. Es igualmente lo que engendraron, lo admitan o no. Dylan no escuchaba discos de 78 rpm, después de todo, en los suelos de esos lugares donde se alojaba en Greenwich Village, sino los primeros LPs reeditados. Por Dylan me refiero a los años 60. Pero también a Dylan. “Si no hubiera escuchado el disco de Robert Johnson cuando lo hice”, escribió hace 10 años, “probablemente habría habido cientos de mis líneas que habrían sido cerradas”.

1.2.- Texto en inglés (tomado de Scientists visualize magnetic fields at atomic scale with holography electron microscope (phys.org) )

Many advances in electronic devices, catalysis, transportation, and energy generation have been made possible by the development and adoption of high-performance materials with tailored characteristics. Atom arrangement and electron behavior are among the most critical factors that dictate a crystalline material's properties.

Notably, the orientation and strength of magnetic fields right at the interface between different materials or atomic layers are particularly important, and often help explain many peculiar physical phenomena.

Prior to this breakthrough, the maximum resolution at which the magnetic field of atomic layers could be observed was limited to around 0.67 nm, a record set by Hitachi using their cutting-edge holography electron microscope in 2017.

Resultado:

Muchos avances en dispositivos electrónicos, catálisis, transporte y generación de energía han sido posibles gracias al desarrollo y adopción de materiales de alto rendimiento con características específicas. La disposición de los átomos y el comportamiento de los electrones son algunos de los factores más críticos que dictan las propiedades de un material cristalino.

Notablemente, la orientación y la fuerza de los campos magnéticos justo en la interfaz entre diferentes materiales o capas atómicas son particularmente importantes y a menudo ayudan a explicar muchos fenómenos físicos peculiares.

Antes de este avance, la resolución máxima a la que se podía observar el campo magnético de las capas atómicas estaba limitada a alrededor de 0.67 nm, un récord establecido por Hitachi utilizando su avanzado microscopio electrónico de holografía en 2017.

En ambos casos, el resultado es muy bueno, incluso con el lenguaje más técnico del segundo ejemplo. Alguna frase, como la de Bob Dylan, no está muy lograda pero la traducción es buena en general.

2.- Del francés al español ( fragmento de una carta de George Sand a Albert Grzymala)

Jamais il ne peut m’arriver de douter de la loyauté de vos conseils, cher ami ; qu’une pareille crainte ne vous vienne jamais. Je crois à votre évangile sans bien le connaître et sans l’examiner, parce que du moment qu’il a un adepte comme vous, il doit être le plus sublime de tous les évangiles. Soyez béni pour vos avis et soyez en paix pour mes pensées. Posons nettement la question une dernière fois, parce que de votre dernière réponse sur ce sujet dépendra toute ma conduite à venir, et puisqu’il fallait en arriver là, je suis fâchée de ne pas avoir surmonté la répugnance que j’éprouvais à vous interroger à Paris. Il me semblait que ce que j’allais apprendre pâlirait mon poème. Et, en effet, le voilà qui a rembruni, ou plutôt qui pâlit beaucoup. Mais qu’importe ! Votre évangile est le mien quand il prescrit de songer à soi en dernier lieu, et de n’y pas songer du tout quand le bonheur de ceux que nous aimons réclame toutes nos puissances. Écoutez-moi bien et répondez clairement, catégoriquement, nettement. Cette personne[16] qu’il veut, ou croit devoir aimer, est-elle propre à faire son bonheur, ou bien doit-elle augmenter ses souffrances et ses tristesses ? Je ne demande pas s’il l’aime, s’il en est aimé, si c’est plus ou moins que moi. Je sais à peu près, par ce qui se passe en moi, ce qui doit se passer en lui. Je demande à savoir laquelle de nous deux il faut qu’il oublie ou abandonne pour son repos, pour son bonheur, pour sa vie enfin, qui me paraît trop chancelante et trop frêle pour résister à de grandes douleurs. Je ne veux pas faire le rôle de mauvais ange. Je ne suis pas le Bertram de Meyerbeer et je ne lutterai point contre l’amie d’enfance si c’est une belle et pure Alice ; si j’avais su qu’il y eût un lien dans la vie de notre enfant, un sentiment dans son âme, je ne me serais jamais penchée pour respirer un parfum réservé à un autre autel. De même, lui sans doute se fût éloigné de mon premier baiser s’il eût su que j’étais comme mariée.

Resultado:

Jamás puede llegar a suceder que dude de la lealtad de sus consejos, querido amigo; que tal temor no se le ocurra jamás. Creo en su evangelio sin conocerlo bien y sin examinarlo, porque desde el momento en que tiene un adepto como usted, debe ser el más sublime de todos los evangelios. Sea bendito por sus consejos y esté en paz con mis pensamientos. Planteemos claramente la cuestión una última vez, porque de su última respuesta sobre este asunto dependerá toda mi conducta futura, y ya que era necesario llegar a esto, lamento no haber superado la repugnancia que sentía al interrogarle en París. Me parecía que lo que iba a aprender ensombrecería mi poema. Y, en efecto, aquí está, oscurecido, o más bien, muy pálido. ¡Pero qué importa! Su evangelio es el mío cuando prescribe pensar en uno mismo en último lugar, y no pensar en absoluto cuando la felicidad de aquellos a quienes amamos reclama todas nuestras fuerzas. Escúcheme bien y responda claramente, categóricamente, nítidamente. Esta persona a la que él quiere, o cree deber amar, ¿es apta para hacerle feliz, o bien debe aumentar sus sufrimientos y sus tristezas? No pregunto si la ama, si es amado por ella, si es más o menos que a mí. Sé más o menos, por lo que pasa en mí, lo que debe pasar en él. Pregunto para saber cuál de las dos debe olvidar o abandonar para su tranquilidad, para su felicidad, para su vida, que me parece demasiado inestable y demasiado frágil para resistir grandes dolores. No quiero desempeñar el papel de ángel malo. No soy el Bertram de Meyerbeer y no lucharé contra la amiga de la infancia si es una bella y pura Alice; si hubiera sabido que había un vínculo en la vida de nuestro hijo, un sentimiento en su alma, nunca me habría inclinado a respirar un perfume reservado para otro altar. De igual manera, él sin duda se habría alejado de mi primer beso si hubiera sabido que yo era como casada.

que también es muy bueno. Quizá ese "era como casada" por "estaba casada", suena extraño, pero es una buena trauducción.

3.- Del alemán al español ( tomado de Maler Neo Rauch stellt in Bensheim aus (faz.net) ):

Eintrag in das Goldene Buch der Stadt, viel Händeschütteln, noch mehr Selfies und eine so drangvolle Enge drinnen wie draußen im schönen Innenhof des Museums, dass man Sorge um die Bilder bekommen könnte: So viel Auflauf bekommt manches große Haus nicht hin, anlässlich einer Eröffnung. Im Museum Bensheim ist der Maler Neo Rauch zu Gast und halb Leipzig und ein Gutteil Berlins scheinen mit an die Bergstraße im Süden von Hessen angereist zu sein, samt den lokalen Kunstfreunden, von denen es enorm viele gibt.

Aufgeräumt macht Rauch den Rummel mit und erläutert bereitwillig, was ihm Farbe bedeutet, warum er als junger Mann „mit den großen Jungs mitspielen“ wollte und merkte, dass Abstraktion nicht sein „Wesenskern“ sei.

Die „Wärme“, die ihm kleinere Ausstellungsorte zurückspiegelten, wie er sagt, kann Neo Rauch an diesem Abend garantiert empfinden. Und Museumsdirektor Christoph Breitwieser, der ein Händchen für bemerkenswerte zeitgenössische Kunst im Rahmen eines Museums hat, das in großen Teilen der lokalen Kulturgeschichte gewidmet ist, hat Rauch schon 2023 bewiesen, dass Bensheim ein guter Ort ist.

Resultado:

Entrada en el Libro de Oro de la ciudad, muchos apretones de manos, aún más selfies y una multitud tan densa dentro como fuera en el hermoso patio interior del museo, que uno podría preocuparse por las obras de arte: Tal aglomeración no se ve en muchas inauguraciones. En el Museo Bensheim está presente el pintor Neo Rauch y parece que medio Leipzig y gran parte de Berlín se han trasladado a Bergstraße, en el sur de Hesse, junto con los numerosos amantes del arte locales.

Con actitud serena, Rauch participa en el bullicio y explica de buena gana lo que significa el color para él, por qué de joven quería "jugar con los chicos grandes" y se dio cuenta de que la abstracción no era su "esencia".

La "calidez" que, según dice, le devuelven los lugares de exhibición más pequeños, Neo Rauch seguramente la puede sentir esta noche. Y el director del museo, Christoph Breitwieser, que tiene un buen ojo para el arte contemporáneo notable en el marco de un museo en gran parte dedicado a la historia cultural local, ya demostró a Rauch en 2023 que Bensheim es un buen lugar.

Es una traducción un poco más tosca que la obtenida en los otros idiomas, pero, en cualquier caso, más que aceptable.

4.- Del euskera al español ( tomado de Veni, Vidi, Bini - - Goiena.eus ) :

Gehiago espoero zen gaurko etaparekin, baina biharkoak beldur apur bat eragin du tropelean, eta ez da borroka handirik eman oilarren artean. Ihesaldia sortzeko lehia ere laburra eta azkarra izan da, etapa hasi eta berehala sortu baita eguneko abenturazaleen apustua. Uno X-ko Abrahamssen, eta Education First-eko Powless eta Bisseger-ek osatu dute ihesaldia. Tropelak, baina, ez die tarte handirik eman, minutu pasatxoa, eta EF-eko bi lagunek geratzea erabaki dute. Abrahamssen bikingoak ez, eta bidea egin du bakarrik. Buruan lagun bakarra zegoela jakinda, lasaitu egin da tropela, eta norvegiarrak sei minutuko zuloa ireki du, ihesean 170 kilometro osatu arte.

Alperreko ahalegina, dena den, etapa garaipenari begira, tropelak aise irentsi baitu 14 kilometrora. Helmuga bihurri samarra zen, igoeran, eta azken 150 metroak %6 edo %7ko pendizarekin. Horrekin nahiko ez, eta haizea kontran. Pazientzia erabakigarria izan bide zen esprintean, eta halatsu jokatu du etapa garaileak, Biniam Grmay-k. Eritrearra ez da Philippsen edo De Lie-ren berotuekin itsutu, eta azken 50 metroetan bakarrik hartu du tropel burua. Hartu behar zenean. Nahiko. Philippsen baino indartsuago iritsi da une erabakigarrira, eta aise menderatu du belgikarra. Veni, Vidi eta Bini! Etorri nintzen, ikusi nuen, eta Bini, Biniam Grmay. Oilar nagusien artean ez da diferentziarik egon.

Resultado:

Se esperaba más de la etapa de hoy, pero la de mañana ha causado un poco de temor en el pelotón, y no ha habido mucha lucha entre los gallos. La competencia para formar la escapada también fue breve y rápida, ya que la apuesta de los aventureros del día se formó tan pronto como comenzó la etapa. Abrahamssen del Uno X, y Powless y Bisseger del Education First, formaron la escapada. Sin embargo, el pelotón no les dio mucho margen, apenas un minuto, y los dos del EF decidieron parar. El vikingo Abrahamssen no, y continuó solo su camino. Sabiendo que solo había un compañero en la cabeza, el pelotón se relajó, y el noruego abrió un hueco de seis minutos, completando 170 kilómetros en fuga.

Un esfuerzo en vano, sin embargo, de cara a la victoria de etapa, ya que el pelotón lo alcanzó fácilmente a 14 kilómetros de la meta. La llegada era algo complicada, en subida, y los últimos 150 metros con una pendiente del 6% o 7%. Como si eso no fuera suficiente, el viento en contra. La paciencia fue decisiva en el sprint, y así actuó el ganador de la etapa, Biniam Grmay. El eritreo no se dejó cegar por la calentura de Philippsen o De Lie, y tomó la cabeza del pelotón solo en los últimos 50 metros. Justo cuando debía. Suficiente. Llegó al momento decisivo más fuerte que Philippsen, y superó fácilmente al belga. ¡Veni, Vidi y Bini! Vine, vi y Bini, Biniam Grmay. No hubo diferencias entre los principales gallos.

También, una excelente traducción.

8/7/24

The Ballad of Geeshie and Elvie

The Ballad of Geeshie and Elvie, de John Jeremiah Sullivan, es un relato multimedia publicado por The New York Times hace 10 años pero que resiste más que bien el paso del tiempo como reportaje periodístico de calidad, de buena literatura, de apropiada combinación entre texto y elementos adicionales multimedia.

Narra la historia de dos mujeres afroamericanas, Elvie Thomas y Geeshie Wiley, que en 1930 grabaron tres discos de canciones para la Paramount en un olvidado estudio de Wisconsin, en la costa oeste del Lago Michigan, para desaparecer del circuito artístico a continuación. Sin embargo, los discos tenían tal calidad e innovación que cambiaron el curso del blues y han constituido una referencia de la música popular americana por más de medio siglo. Particularmente, dos de las canciones: "Motherless Child Blues" de Elvie y "Last Kind Words Blues" de Geeshie.

¿Qué ocurrió? ¿Quiénes eran Thomas y Willey? ¿De dónde venían? ¿De Mississipi, como suponían algunos; de Louisina, como decían otros? ¿A dónde se fueron? ¿Dónde están sus tumbas?

Sullivan, en este trabajo, investiga aquellos hechos en una obra de pura literatura y ejemplo de buen periodismo.

Embebidos en el texto de la historia, se colocan fotografías, vídeos y contenidos sonoros que no son un simple aderezo sino que completan, amplían y mejoran el reportaje al ser interesantes, apropiados y sabiamente elegidos.

Puede leerse y disfrutarse desde este enlace. No hay que perdérselo, aunque hayan pasado 10 años.