7/12/23

Gemini

 


Google ha presentado su sistema conversacional, un LLM (Large Language Model), denominado Gemini, otro competidor en la arena donde lidian ChatGPT, Bard y demás chatbots avanzados. Se trata de una red neuronal multimodal estructurada en  tres niveles de uso llamados Gemini Ultra, Gemini Pro y Gemini Nano, con más o menos potencia de proceso según la aplicación a que se quiera destinar y en función del dispositivo donde vaya a funcionar, siendo más ligera, por ejemplo, la versión destinada a dispositivos móviles y más pesada y profunda la que pueda correr en ordenadores potentes.

El que sea multimodal, según Google, significa que puede comprender informaciones textuales, de imágenes, desde audio, desde vídeo o desde código de programación. La empresa afirma que Gemini puede generar código en Python, Java C++ y Go, pudiéndose utilizar, además, como motor para sistemas de codificación como AlphaCode 2.

Google integrará Gemini en sus teléfonos Bard y Pixel 8 Pro y en las próximas semanas se integrará con Chrome, Search, Ads y otros. Los desarrolladores podrán implementarlo a través de la API de Gemini en Google AI Studio o Google Cloud Vertex AI.

Más información sobre el producto en este enlace.

Por supuesto, habrá que filtrar el marketing y esperar para ver y creer.




5/12/23

Extracción de los datos con que fue entrenado ChatGPT

 


Investigadores de varias instituciones, entre las que se cuentan Cornell, la Universidad de Washington, o Google Deep Mind han logrado que ChatGPT muestre las fuentes con las que fue entrenado, mediante técnicas muy sencillas.

En un artículo recientemente publicado, (original, en este enlace) muestran cómo requiriendo a ChatGPT que repita ciertas palabras indefinidamente, el texto generado por la red neuronal acaba por mostrar snippets de los datos que se utilizaron para su entrenamiento. Así, muestran que hay información que pertenece a individuos o instituciones, algo que puede crear importantes problemas de privacidad, y que hay textos generados que no lo son tal, sino solamente un copia-pega de textos ya almacenados en la red por otros. Esto es especialmente grave ya que mientras que el marketing vende que se trata de sistemas de inteligencia artificial que pueden remedar el cerebro humano (incluso, con noticias en prensa del riesgo de ser dominado por ella), en realidad hay una buena parte de memorización masiva de textos aprovechando el bajo coste por unidad de las memorias actuales de ordenador, una especie de loro que repite, algo muy alejado de la verdadera generación.

Los investigadores pidieron a ChatGpt que repitiera indefinidamente la palabra "poem" (poema) y, obviamente, así lo hizo durante mucho tiempo hasta que,  de pronto y por sorpresa, empezó a mostrar información privada perfectamente reconocible.

El artículo científico muestra numerosos ejemplos de cómo la información de entrenamiento puede ser extraída y de cómo, en muchas ocasiones, se vuelca al usuario como una simple copia.

Hay que imaginar que ChatGPT estará ya parcheando el sistema para que no muestre información privada pero esto no elimina el problema de fondo, el de la poca inteligencia de la red neuronal. Que no se vea no significará que no exista.

Los científicos concluyen que es posible extraer gran cantidad de información del entrenamiento de todo este tipo de redes neuronales, no sólo de ChatGPT sino de sistemas similares como LlaMA, GPT-Neo o Pythia.

Como indican los autores, hay que comenzar a pensar no en que la IA puede destronar a la humanidad sino si, realmente, son sistemas seguros que garantizan la privacidad y protección de datos.




4/12/23

Terminal

 


Terminal, del brasileño Flàvio Komatsu, es una novela hipertextual compuesta en el año 2018. De manera similar al tipo de relatos interactivos, muestra ciertos párrafos tras los cuales el lector debe elegir entre varios caminos, de modo que la novela siga uno u otro derrotero en la trama.

Sin embargo, Terminal, tiene añadidos que lo vuelven más original. Para empezar, puede comenzarse la lectura por puntos que no son el inicio de la obra. Por otro lado, dispone de un interface similar a un computador con, llamémoslos así, pulsadores que nos sacan a poemas o informaciones adicionales que, en sí mismos, constituyen otro relato. Y, para acabar, lleva un reproductor de música integrado que dispone de una play list con lo que puede acompañarse la lectura con una banda sonora.

Puede leerse desde este enlace. Está en portugués.







1/12/23

Littérature et cartographie numérique : gestes d’écriture contemporains

 


Hasta el 15 de enero del 2024 está abierto el plazo para presentar ponencias al evento Littérature et cartographie numérique : gestes d’écriture contemporains, que se celebrará en el campus UCLouvain Bruselas los 6 y 7 de junio del 2024.

Desde siempre, la literatura ha echado mano de mapas y cartas geográficas para apoyar las historias o permitir al lector seguir las aventuras de los personajes. En el coloquio que se anuncia, se pretende analizar cómo la cartografía digital permite realizar nueva literatura esta vez con mapas digitalizados, interactivos, etc. Conferencias que estudien cómo usar mapas en ventanas emergentes, mapas en tiempo real, zooms, geolocalización, etc.

El coloquio estará dirigido por Isabelle Ost.

Más información en este enlace.




29/11/23

Grafo de enlaces en Neurocracy

 


Ya en 2021, en esta entrada de Biblumliteraria, nos hicimos eco de un juego hipertextual por capítulos con un interface tipo Wikipedia, llamado Neurocracy.

Ahora, Younés ha creado un grafo en que se muestran todas las relaciones entre personajes y hechos aparecidos hasta ahora en Neurocracy. Puede hacerse zoom sobre cualquier parte de la red de nodos y, pulsando el botón derecho del ratón, puede moverse la escena de un lado para otro. 

Puede accederse al grafo desde este enlace.





27/11/23

Búsqueda sobre datos de un libro

 


Enotes es una aplicación destinada a estudiantes y profesores de literatura que permite buscar información sobre un libro dado. La pantalla de inicio habla de "any", "cualquier", libro pero está limitado a libros publicados en inglés y con cierta popularidad. 

Una vez introducida la pregunta (¿De qué trata Moby-Dick? ¿Cuál es el principal personaje de El conde de Montecristo?, etc.), el programa responde con una lista de enlaces, algunos propios de Enotes, otros externos, que nos darán la información deseada.

Funciona en inglés y esto significa que los títulos de los libros, por ejemplo, deben usarse con su traducción en inglés. 

Es un programa que, a pesar de ese "pregunta lo que quieras" de su pantalla de inicio, no pretende emular a los generadores de texto tipo ChatGPT pero que, en su sencillez, ofrece unos resultados muy interesantes.

Puede accederse desde este enlace.








26/11/23

Electronic Beowulf, 4ª edición

 

La cuarta edición de la versión electrónica de Beowulf permite un estudio a fondo del poema épico medieval más importante de la literatura anglosajona primitiva. 

En este edición, no sólo puede leerse una transliteración actualizada de los más de 3000 versos que componen el cantar, sino que los estudiosos tienen acceso a multitud de versiones, análisis, comparativas y referencias. Las páginas de los facsímiles están escaneadas con gran calidad en 70 imágenes convencionales, 130  escaneados ultravioletas y 750 imágenes tomadas con luz de contrate que permiten observar los palimpsestos a que dieron lugar ciertas restauraciones.

Por supuesto, el buscador es muy potente para poder localizar un verso o un documento de manera rápida. Existe, también, un diccionario embebido con el cuál es posible ver la definición de palabras ya obsoletas o sintaxis anticuadas. 

El navegador se puede configurar de diversas formas para que cada persona pueda situar cada ventana de contenido de acuerdo a sus necesidades.

Su uso es completamente libre y puede accederse a tan magnífica web desde este enlace.

 








25/11/23

II Congresso Internacional LITDIGBR

 


Se anuncia la convocatoria del II Congresso Internacional LITDIGBR, que se celebrará entre los días 14 y 16 de mayo del próximo año 2024. Como su nombre y acrónimo indican, se trata del Congreso de Literatura Digital en Brasil que tendrá lugar en la Universidad Federal, en Cuiabá, Mato Grosso. Se plantea como un foro de encuentro de teóricos, escritores y programadores de literatura electrónica producida  en Brasil y América latina.

En este momento, se abre el plazo de presentación de ponencias para su análisis por el comité evaluador. Pueden enviarse las propuestas hasta el 10 de marzo del 2024 si son teóricas y hasta el 10 de abril si incluyen trabajos prácticos.

Todos los detalles específicos pueden verse en el portal del evento.



23/11/23

Claude

 


Aunque los generadores de texto que más importancia y celebridad han tomado en los últimos años son ChatGPT (este, con todos los cotilleos de la guerra de familia en Open AI), Bing Chat y Bard, existen otros entre los que cabe destacar CLAUDE, creado por la firma Anthropic

Claude, como los otro sistemas, es un chatbot, una red neuronal que puede generar conversaciones a partir de interacciones en lenguaje natural con el usuario. La versión utilizable de modo general se ha lanzado en este año 2023 y desde este web puede uno registrarse y utilizarlo.

Claude tiene mucho menos recursos y nodos que sus hermanos mayores pero su entrenamiento está más enfocado a cuestiones técnicas y matemáticas y, además, desde el comienzo, tiene una mayor capacidad de seguir el contexto, algo que por ejemplo ahora está implementando la nueva versión de ChatGPT. Aún así, según Anthropic la ventana de contexto admite 100K tokens, que es muy grande en relación a sus competidores. Una capacidad así permite introducir un texto de unas 70.000 palabras, una novela corta, y preguntarle cualquier cosas sobre ella o pedirle que haga resúmenes completos de la misma.

El enfoque técnico hace que se base muy estrictamente en datos probados con lo que, de paso, se obtiene un mejor control de las "alucinaciones" (respuestas falsas), o textos no éticos. Sin embargo, carece de un elemento fundamental en asuntos técnicos cual es proporcionar los enlaces a las fuentes que ha utilizado para generar las respuestas.

La interface es muy similar a la de Bing Chat, con una barra de scroll y simples cajas de texto, alineadas a derecha e izquierda, según quién "hable".

El tiempo de respuesta es más largo que ChatGPT 3




21/11/23

Recordando a Marjorie Luesebrink

 


Marjorie Luesebrink fue una de las escritoras pioneras de literatura digital. Nacida en 1943, desarrollo obras hipertextuales bajo el seudónimo de M.D.Corveley. Destacó con sus novelas multimedia Califia y Egypt: The Book of Going Forth by Day.

Luesebrink falleció el pasado 4 de octubre de este año.

Se ha convocado a todos los que la conocieron a aportar sus recuerdos y comentarios sobre la escritora, plasmándolos en un documento colaborativo en línea que puede encontrarse aquí.

El documento estará abierto a las aportaciones hasta el 15 de diciembre y, después, quedará archivado en The Marjorie C. Luesebrink Collection en The NEXT (the-next.eliterature.org).





20/11/23

An Alarm of Fingers

 


An Alarm of Fingers, de Jessica Tremblay, es un generador poético automático que va creando versos, uno tras otro, mediante algoritmos de combinación. Una vez generados, se imprimen sobre un simple paisaje de atardecer que permanece estático. 

El generador de texto está programado en javascript y basado en el programa "Why 2K", de Stuart Moulthrop. 

Los textos que se combinan proceden de obras de Tremblay de la mejicana M. Paulino.

Puede verse desde este enlace.