7/4/20

Corpa de Internet





La web TenTen, de Lexical Computing Ltd,  incluye un enorme conjunto de corpa lingüísticos en distintos idiomas, entre los que se encuentra el español, subdivido en dos corpa, uno para la Península ibérica y otro para Hispanoamérica.

Se trata de una base de datos de textos de internet, de un volumen muy importante, filtrado para evitar repeticiones y con una amplia y rica anotación de metadatos que permiten realizar todo tipo de búsquedas, comparaciones y manipulaciones del contenido.

Para acumular datos, el sistema dispone de un robot buscador que, dependiendo del idioma, analiza las webs e informaciones (webpages, informes, diarios, reportes, etc.) dadas en alta en países con dicho idioma como oficial o dominante. Se extraen, entonces, sólo los párrafos lingüísticas, eliminando elementos multimedia, todas las instrucciones HTML y javascript,  o palabras aisladas. Luego, una vez que se tienen las frases que interesan, se categoriza cada palabra individualmente y se lematiza, añadiéndole los metadatos necesarios.

Para sacar el máximo provecho de los corpa, los buscadores, analizadores y comparadores son muy potentes.

Además de los corpa en español, existen otros tan amplios o más en inglés, chino, francés, coreano, japonés, árabe, alemán, italiano, portugués y ruso, entre otros, hasta 35 idiomas. Todo este ingente material de varios miles de millones de datos es accesible desde Sketch Engine. El objetivo es llegar a los diez mil millones de datos.







6/4/20

De la actividad del córtex al texto






Poder decodificar el habla directamente desde el cerebro es un objetivo que se ha perseguido desde hace muchos años. Ha habido algunos pequeños avances pero el éxito está muy lejos aún. Si llegara a lograrse, podrían tomarse las señales cerebrales y traducirlas a lenguaje emitido por un altavoz sin necesidad de que las palabras sean emitidas. Y, llegados a este punto, podría pensarse también en el proceso inverso, Tomar las palabras, y sin escucharlas, introducirlas directamente en el cerebro. Ni que decir tiene que sería un avance revolucionario para sordos y mudos, por ejemplo y los estudios en el campo son continuos. El año pasado, por ejemplo, Biblumliteraria se hacía eco de un trabajo en el mismo sentido.

Aunque el objetivo sigue siendo lejano, investigadores del Center for Integrative Neuroscience y del Department of Neurological Surgery, ambos de San Francisco, han desarrollado un sistema de inteligencia artificial que avanza un poco más en la buena dirección. En concreto, Joseph Makin, David Moses y Edward Chang, han experimentado con la traslación directa de señales del cortex a texto. 

Diversos participantes recitaron repetidamente frases delante de un micrófono mientras se les registraba la actividad neuronal producida al hablar. Esta doble información alimentaba una red neuronal recurrente hasta que esta aprendía a identificar cada palabra con cierto modelo de activación neuronal, extrayendo esas sub-partes de la señal global registrada con la frase. Esta aproximación por frases completas es muy interesante.

Para realizar el experimento, se usaba un conjunto de 250 sensores de actividad en el córtex perisilviano.

Los resultados, aunque limitados, son interesantes y esperanzadores.

El artículo técnico, publicado en Nature, puede leerse en este enlace. Al final del mismo, los autores señalan los enlaces desde donde puede descargarse el código usado para entrenar a la red neuronal.



5/4/20

La Conferencia de la ELO 2020 será virtual





Debido a la crisis sanitaria mundial provocada por COVID-19, le conferencia anual que celebra la Electronic Literature Organization se realizará de manera virtual a través de teleconferencias, presentaciones televisadas, redes sociales, podcasts, tertulias on-line, etc. 


En este momento, los organizadores están recogiendo propuestas para evaluar qué canales telemáticos serán puestos en marcha durante el evento.


Las fechas serán del 16 al 19 de julio.


Para más información, puede accederse a la página de le ELO.



4/4/20

Juego literario de la RAE




Hoy se desarrolla un juego literario en Twitter organizado por la RAE. A través de pistas lexicográficas y literarias, los participantes deben ir avanzando en la narración, encontrando nuevos lugares o elementos para que una agente llegue a su casa.

Una buena y formativa diversión en estos tiempos de confinamiento sanitario.

Puede verse el hilo en este enlace.



2/4/20

Cuadernos de viaje





José Naranja es un artista madrileño que realiza maravillosos cuadernos de viaje. Comenzó rellenando moleskines comerciales per, al final terminó fabricando los suyos propios.

El diseño está extraordinariamente cuidado, mezclando texto con cuidada caligrafía, gráficos de alta calidad, collages de muy buen gusto y diseño exquisito. Una invitación a detenerse en cada página, no sólo de leerla sino a disfrutar de su diseño.

No sólo tratan de viajes sino de historias e informaciones diversas.

En este enlace, la página del autor de estos cuadernos de viaje.




1/4/20

International Publishers Congress





El International Publishers Congress, que fue anunciado a primeros de mes en Biblumliteraria, ha anunciado su cancelación debido a la pandemia de coronavirus que sufre el planeta. Debía celebrarse a final de mayo pero la incertidumbre aconseja su cancelación.


La cancelación y sus detalles pueden verse en la página del Congreso.



30/3/20

El remedio de Aldorf





El remedio de Aldorf, es un relato hipertextual del tipo aventura interactiva en la que después de ciertos párrafos el usuario debe elegir entre diversas opciones. Existen diez finales alternativos a los que puede llegarse en función de las decisiones que tome el lector.

La historia se desarrolla en la Edad Media. Es preciso viajar al pueblo de Aldorf para buscar una medicina que sanará a un familiar muy enfermo. El camino estará lleno de trabas y elecciones a realizar. 

La red de decisiones no es unívoca de modo que puede llegarse a un mismo final incluso tomando una combinación de elecciones distintas. Asimismo, se coleccionan objetos y hay una componente de juego evidente.

Está disponible para Android y para la plataforma Apple y puede descargarse desde este enlace.







28/3/20

El infinito en un junco



El infinito en un junco, (Siruela, 2019), de Irene Vallejo, es un muy interesante ensayo sobre la evolución de la escritura, desde que se utilizara el papiro de junto hasta los más modernos soportes.

A lo largo de más de 400 páginas, Vallejo, Doctora en Filología Clásica por las Universidades de Zaragoza y Florencia, recorre la historia del libro y las bibliotecas en una sucesión de historias atractivamente contadas y que se relacionan con la actualidad de mil maneras diferentes, referencias al cine, a la literatura actual y hechos de actualidad. 

La autora hace un libro de historia saltando de eventos fácilmente reconocibles: la biblioteca de Alejandría, la ciudad de los papiros de Herculano, el catálogo de Calímaco, la redacción del Decamerón de Petrarca, de los escritos de Eróstrato, de concursos literarios en la Gracia clásica, del pergamino creado en Pérgamo o la infinita Babel de Borges. Vallejo aúna un buen estilo literario con una maestría didáctica notable. Va ligando una historia con otra en un continuo interesante y bien hilado, trufado de experiencias personales y adornado con multitud de anécdotas que hacen la lectura muy amena y que denotan el profundo conocimiento de la autora.



   

27/3/20

Análisis matemáticos del léxico que denota emociones





Joshua Conrad Jackson de la University of North Carolina, Joseph Watts de la University of Otago, Teague Henry de la University of North Carolina, Johann-Mattis, Robert Forkel2, Peter J. Mucha y otros investigadores han publicado los resultados en el análisis computacional de lingüística comparativa de las palabras que denotan emociones (amor, temor, orgullo, odio, tristeza, envidia, ansiedad, etc) en numerosos idiomas. En concreto, en un conjunto de 2474 idiomas que pueden agruparse en 20 grandes grupos lingüísticos. Y 2439 palabras en esos idiomas anteriores.

¿Palabras que, en diversos idiomas, parecen definir una misma emoción representan realmente la misma emoción? ¿Cuando un angloparlante dice love siente lo mismo que cuando un hispanoparlante dice amor? ¿y estos sienten lo que un turco define como sevgi? ¿Son las emociones básicas algo que está ya grabado en el cerebro o están fuertemente influenciadas por las culturas locales? 

El nuevo estudio analiza las palabras que definen las emociones usando la colexificación, un proceso lingüístico que auna la polisemia y la homonimia y trata sobre el uso de una misma palabra para hablar de conceptos distintos.  Los idiomas recurren a describir cosas diferentes con una misma forma léxica. Por ejemplo, en español, la palabra vela describe un cirio y una tela para el viento; la palabra pueblo describe tanto un poblado como un conjunto de personas con cultura común. Este fenómeno da pistas interesantes sobre cómo se viven las emociones. ¿Por qué, por ejemplo, unas lenguas usan la misma palabra para definir el dolor y el remordimiento, mientras que otras unen dolor y ansiedad? ¿Se siente el dolor como un remordimiento?

Se han creado redes que ligan las palabras con las emociones y con otras emociones viéndose las relaciones emocionales dentro de la propia lengua y de unas lenguas a otras de los significados. El proceso requiere un buen trabajo de codificación del corpus con un sistema formal solido. Se han adscrito a cada emoción diversos cualificantes ( Valencia - impacto positivo/negativo-, activación - intensidad de la emoción-, certitud, sociabilidad, etc.). Una vez que el cálculo computacional ha ponderado estas redes se llega a conclusiones interesantes, en concreto que sí parece existir, aunque no de manera totalmente determinante, que hay un sustrato biológico universal en las emociones especialmente en cuanto a la valencia (si la emoción afecta positiva o negativamente a la persona) y a la activación (intensidad de la emoción), pero hay excepciones por lo que no es 100% concluyente.

La técnica resulta muy interesante porque permite abrir nuevas vías en el análisis del cambio semántico y encontrar relaciones antes no imaginadas.

Puede leerse el artículo completo en este enlace.





21/3/20

Bottom of the Ninth





Bottom of the Ninth, de Ryan Woodward, es un cómic animado (motion comic), en el que algunas de las viñetas tienen movimiento. Está diseñado para Ipad y IPhone y puede encontrarse en este enlace.

Se trata de una historia que transcurre a finales del siglo XXII en una ficticia ciudad llamada Tao City. En un popular deporte de esa futura época, el New Baseball, una chica, la primera que lo juega, debe luchar contra las discriminaciones.

Excelentes gráficos, siempre en tonos sepias y esquemáticos, de gran fuerza dramática. Excelentes animaciones.







19/3/20

The Digital Grave





The Digital Grave, es un portal digital, creado por Leah Pope Parker de la University of Southern Mississippi, que muestra uno de los poemas más antiguos en inglés medieval antiguo, el llamado "The Grave" (La Tumba), que está contenido en el manuscrito de la Bodleian Library, el MS Bodley 343, guardado en Oxford. Fue escrito en el siglo XII

Permite ver la digitalización del manuscrito original, su traducción sugerida para cada palabra al inglés moderno (o varias, si el significado del verso así lo exige), una edición moderna y otras muchas posibilidades. Cada opción se va mostrando en una ventana independiente que se visualiza sobre el lado derecho de la pantalla, manteniéndose en el izquierdo, si así se desea, el menú de opciones.

Puede disfrutarse desde este enlace.