lunes 7 de junio de 2010

Skeleton Creek. El diario de Ryan


Skeleton Creek no es una novela digital en realidad pero su originalidad reside en que combina un texto clásico en papel con vídeos alojados en la red que completan la historia. Escrito por Patrick Craman puede incluirse dentro de la literatura juvenil. Sin duda esa generación se encontrará como pez en el agua saltando entre el papel e Internet. Se trata de un relato de misterio que acaece en el pueblo que da nombre al libro y el material que se encuentra en la red complementa la narración desde el punto de vista de una de las protagonistas. Puede verse parte de estos vídeos aquí.

Hay ya dos libros publicados. La página oficial del autor está aquí.


Literatura y ámbito digital: derechos y creatividad

La Asociación de escritores en lengua catalana organiza para esta semana (días 9 y 10 de junio) unas jornadas tituladas Literatura y ámbito digital: derechos y creatividad que se celebrarán en el Colegio de Periodistas de Cataluña, en Barcelona. Participarán Ernest Abadal, Ignasi Labastida, Laura Borrás, Llorenç Valverde, Ramon Dachs y Xabier Badosa entre otros. Más información aquí .

domingo 6 de junio de 2010

Cut to the Flesh



Cut to the Flesh de Deena Larsen es una obra sencilla, programada en Flash, que obliga al lector a intentar reconstruir el texto pasando por una serie de interrogaciones. La poca variedad de la interface hace que su atractivo resida en intentar dar un sentido a la serie de frases que se deslizan por la pantalla.


sábado 5 de junio de 2010

The Wave


The Wave es una interesante obra, inquitante y mística, que combina textos, sonidos, fotos, voces y gráficos. Escrita por Heather Raikes en el año 2006, incluye la colaboración de varios otros artistas en cuanto a la música y los componentes multimedia. Está programado en Flash.


Para explicar el concepto, nada mejor que copiar la propia visión de la autora:


The Wave is an electronic text derived from a series of media performances. The work explores and articulates a collection of meditations on myth, metaphor, and embodiment.An interactive assemblage of images, videodance, sound, animation, iconography, and text, The Wave creates an electronic architecture of hyper-dimensional poetic language. This electronic architecture expands and redefines the dramatic text as a fluid, animated, interactive infrastructure that exists in a liminal hyperspace between text and performance. The work expands and redefines the dance as dynamic, sensate, experiential process of inner transformation integrating the mind, body, and senses in metaphorical movement.Cumulatively, The Wave is a posthuman myth derivative of Joseph Campbell's monomyth. The dancing body of a woman warrior embodies the fundamental metaphor. She encounters gods, goddesses, enigmas and archetypes, all of which are reflections of herself in virtual space. Her psyche is reflected, refracted, expanded, and transformed into vertical, virtual dimensions. She becomes a meta-body: an elusive, shape-shifting equation of light, intelligence, rupture, and complexity."The body is not just repositioned by new technologies but supplemented, extended, and remade into a material-information entity whose boundaries are continuously constructed and reconstructed in its interactions with instruments whose total cognitive capacity exceeds our individual knowledge." – Adalaide Morris, New Media PoeticsFinally, The Wave is an electronic exploration of the format of the illuminated manuscript, most commonly associated with poet/artist William Blake. In traditional illuminated manuscripts, gold ink was used to represent the "light of God" illuminating the text. In this work, the light is electronic and represents the force of contemporary mythic experience through the exponentially expanding apertures of the digital.


Es un trabajo interesante, cuidada, aunque uno debe estar preparado para enfrentar los discontinuo, lo fragmentado, esperar más una impresión de ánimo poética imprecisa que una historia.

El futuro de la edición: papel y e-book

Dentro de un mes, del 7 al 9 de Julio, se celebrará en Santander un encuentro internacional bajo el título El futuro de la edición: papel y e-book que tendrá lugar en la Universidad Menéndez Pelayo, organizado por la Federación de Gremios de Editores de España. Participarán, por ejemplo, Ian Hudson, CEO de la editorial Random House y Olivia de Dieuleveult, editora de Flammarion. Será dirigido por Núria Cabutí, de Random House Mondadori. El encuentro se organiza en base a mesas redondas con los siguientes tópicos:

- El papel del editor a futuro. Capacidad de crear contenido a partir de contenido
- Los retos del editor de hoy
- El editor como autopromotor. Las nuevas herramientas: de la web a las redes sociales
- Librerías-Mundo digital versus papel
- Derechos digitales, copyright y copyleft. Descargas y recargas. Del Kindle al Ipad
- Nadie acabará con los libros
- Los editores ante el reto de la escuela 2.0 y la Universidad Digital

El programa completo puede verse aquí.

viernes 4 de junio de 2010

Lingüística computacional (VII)




(El capítulo anterior de la serie puede leerse aquí)






Como ya vimos en capítulos anteriores, la clasificación de Chomsky de las gramáticas situaba a las de libres de contexto (de tipo 2) en un orden inferior a las transformacionales ya que, según él, no permitían la generación de todas las oraciones de los idiomas naturales y no permitían capturar generalizaciones.

Los trabajos de Pullum y Gazdar vinieron a contradecir este concepto. Hicieron ver que no existían pruebas de que frases de las lenguas naturales no pudieran ser descritas con gramáticas libres de contexto y, cuando menos, que la enorme mayoría de las expresiones podían generarse con las mismas. Siendo las gramáticas libres de contexto más sencillas de tratar informáticamente, el que eventualmente algún extraño caso quedara fuera de las mismas no disminuía su valor práctico.

Una de las primeras gramáticas libres de contexto desarrolladas fue la Generalized Phrase Structure Grammar o GPSG que en español suele denominarse Gramática de estructura sintagmática generalizada

GPSG rechaza los dos niveles, profundo y superficial, que propugnaban las gramáticas transformacionales que para esta teoría no dejan de ser cábalas no justificadas científicamente. Es por lo tanto, monoestratal. Cada oración tiene una única representación sintáctica. Para explicar la enorme casuística del idioma, Gazdar, Gunji y Pullum recurrieron a introducir la recursividad, es decir, en vez de definir el lenguaje mediante una serie de reglas fijas y transformaciones, se establecen una serie de principios que describen las generalizaciones posibles. En concreto, GPSG crea el formato ID/LP (Inmediate Dominance, Lineal Precedence) e introduce las metarreglas, un concepto que llegaba de los sistemas expertos de la inteligencia artificial. La gramática GPSG adopta la Teoría X-barra que ya hemos visto en capítulos anteriores.

A diferencia de las gramáticas transformacionales que defendían una innata capacidad sicológica para le lenguaje y una norma universal subyacente en todos los idiomas, la GPSG rechaza toda interpretación neuronal y hace énfasis en el lenguaje formal que describe la gramática que constituye, de hecho, el elemento universal más que una gramática innata.


ID/LP

En español se denomina como formato Dominio inmediato/Precedencia lineal.

Se define Dominio Inmediato como la relación existente entre un nodo del árbol sintáctico y sus nodos hijos que están inmediatamente debajo de él. Su nomenclatura es:


A -> B, C, D ( y se admite que alguno de los componentes de la derecha pueda no existir)

Que gráficamente equivaldría a:


Las reglas ID especifican los términos de una oración y las relaciones de dominancia entre ellas.

Se define Precedencia lineal como el orden posible entre categorías hermanas, es decir entre las que aparecen en un nivel del árbol. Se nombra con el símbolo “<”: A<B (A precede a B)

La precedencia lineal no está ligada a reglas concretas sino que es válida para toda la gramática.

Expliquemos cómo afectaría una regla LP a una ID . Sea la regla GPSG:

A->B,C,D (por ejemplo SN-> DET, N, Adj

Con esta reglas podemos crear seis árboles que corresponden a las posibles permutaciones de los componentes del lado derecho de la regla.



Primero, vemos que respecto a otro tipo de gramáticas hemos conseguido una simplificación notable ya que esa sola regla sustituye a seis. Pero, además, es evidente que la regla es tan potente que genera oraciones cuyo orden es incorrecto. ¿Cómo limitarla? Con las reglas LD. Si, por ejemplo, tenemos, una regla LD del tipo:

B<C

Que recordemos se aplicaría a todas las reglas generadas desde el nivel ID. Como, de acuerdo a esta última regla LD, “B” siempre debe preceder a “C” , los únicos árboles válidos serán estos tres:




Apliquemos estos conceptos. Sea la regla ID:

SN-> Art, N, Adj, SP, OREL

y las reglas LD:

N<SP
N<OREL


Observamos que estas tres reglas nos producen muchas oraciones válidas (que antes habría que haber escrito una a una), como:



SN->Art+N

SN->Art+N+Adj

SN->Art+N+OREL

Pero es que además, permite el sintagma nominal:

SN->Art+Adj+N+Adj ya que se permite la ubicación de los componentes en cualquier lugar siempre que lo permitan las reglas de precedencia lineal. Y en el ejemplo no hay ninguna regla LD que diga que no puede haber un adjetivo antes que el nombre

Y, claro, no permite, por ejemplo:

SN->SP+N+Adj


Se observa que esta forma de definir la gramática sí está permitiendo generalizaciones. Que el nombre deba preceder a la oración de relativo (en el ejemplo) es una generalización que puede aplicarse a cualquier otra regla sin necesidad de escribir todas las combinaciones posibles,

Las metarreglas

Las metarreglas son reglas que reflejan generalizaciones sobre las relaciones entre estructuras. Una metarregla proyecta un conjunto de reglas ID sobre otro conjunto.

Supongamos, por ejemplo, que tenemos un conjunto de de reglas que generan las oraciones activas. Podemos tener, asimismo, otro conjunto de reglas que generan esas mismas oraciones en pasiva. Ahora bien, si analizamos ambos conjuntos veremos que muchos des sus constituyentes se repiten y que, muchas veces, sólo cambia el orden o pequeños detalles. Entonces, en vez de tener dos conjuntos complejos podríamos disponer de sólo el conjunto que describe la voz pasiva y definir unas metarreglas externas que indiquen cómo se construye la reglas pasivas desde las reglas activas, sin necesidad de duplicarlas.
Las metarreglas no son transformaciones. Aquellas proyectan reglas sobre reglas; estas describen el paso de una sentencia a otra.

Un ejemplo de esto es el tratamiento de las pasivas en inglés:

John sells a book
A book is sold by John


SV-> X, SN

SV(PASIVA)-> X, (“by”, SV)


O lo que es lo mismo: si existe una regla que define el sintagma verbal transitivo activo como una serie de componentes X seguido de un sintagma nominal, entonces la metarregla dice que habrá un sintagma verbal pasivo que tome esa misma serie de componentes y las haga eventualmente seguir por “by” y el sintagma verbal, para formar la pasiva. Así, de He sells the book” podríamos llegar a The book is sold by him

Instanciación

La instanciación de rasgos, tal como se entiende en GPSG, establece la relación existente entre árboles locales y reglas ID. No hay que confundirla con la unificación que vimos en un capítulo anterior aunque se le parece. La instanciación asigna rasgos a las categorías de un árbol siempre que no se violen otras reglas de la gramática.

El rasgo HEAD

En español, se le suele llamar Núcleo. Se trata de la categoría que rige la oración. Del núcleo se traspasan rasgos hacia arriba en el árbol. A la hora de interpretar una regla ID es vital determinar cómo se relacionan los rasgos de las categorías madres con los de las categorías hijas. Por ejemplo, las características de un sintagma nominal vienen determinadas en gran medida por los rasgos del nombre (núcleo nominal); las de un sintagma verbal por los rasgos de su verbo, etc. Así.



Cabría pensar que, para cada regla, sería preciso definir estas matrices que determinan qué rasgos se comparten. Esto sería muy engorroso de tratar informáticamente y, por ende, precisaría una gran cantidad de memoria.

La gramática GPSG toma a este núcleo como un rasgo complejo especial (al que llamaremos HEAD) que contenga todos esos rasgos esenciales podremos generalizar diciendo que para todo sintagma los rasgos de su núcleo deben ser compartidos entre el nodo madre y los nodos hijos. Nos ahorraremos así tener que rescribir cada uno de ellos. El núcleo determinará el resto, esté explicitado o no.

GPSG define que los valores de los rasgos en HEAD del nodo núcleo tienen que coincidir con los valores de los rasgos respectivos en HEAD del nodo madre. Es lo que se llama Convención del rasgo HEAD. O dicho de un modo simplificado, en una regla que termine el sintagma nominal SN-> DET,N en donde la categoría N tiene unos rasgos determinados (es sustantivo, no es verbo, caso nominativo, número plural, género femenino, etc), la categoría madre SN tendrá exactamente las mismas especificaciones de rasgos que el núcleo N.

El rasgo complejo HEAD suele contener los rasgos de concordancia y de tiempo entre otros. Esta convención impone la identidad por defecto pero pueden existir otras reglas o metarreglas que hagan que la convención pueda no cumplirse. Es decir, es por defecto, secundaria respecto a otras directivas.

Llamemos al núcleo H (de HEAD) y supongamos las reglas:

O->SN, H[-SUBJ] (el rasgo SUBJ define si puede ser sujeto (+) o no puede serlo (-))

SN->DET, H
N->H


La regla O[+PLU]->SN[+PLU], H[-SUBJ, +PLU] sería correcta porque por un lado hereda los rasgos del head y por otro es coherente en el rasgo PLU, pero la regla O[-SUBJ]->SN, H[-SUBJ] sería incorrecta porque el rasgo del núcleo se instancia hacia arriba y sólo puede serlo hacia abajo.

Existen, en GPSG, restricciones a la forma en que los rasgos se instancian. Por ejemplo, se tiene el FCR (Feature co-occurence Restriction) y el FSD (Feature Specification Default). Unas restricciones de este tipo podrían ser:

FCR1: [VFORM] <- [+V,-N], lo cual es obvio ya que un rasgo verbal debe referirse a un verbo. O bien FCR4: [NFORM]<-[-V,+N] ya que un rasgo que afecte al nombre deberá estar relacionado con él y, por ejemplo, se restringirá la instanciación de rasgos como el tiempo verbal.

El léxico en GPSG

GPSG asume que una entrada léxica debe contener información sobre las forma fonológica, la categoría sintáctica, el significado y las formas amorfas existentes. Para empezar, GPSG asume que las categorías principales sintácticas pueden ser expresadas por la combinación de dos rasgos (features) llamados nominal y verbal del modo siguiente:



GPSG define una treintena de rasgos fundamentales (N, V, PER, CASE, COMP, ADV. AUX, SLASH, SUBCAT, VFORM, WH, POSS; NULL, NEG, GER, etc) que se reservan para determinar cada entrada léxica y que, para entendernos, vienen a ser como las palabras reservadas de un lenguaje de programación de ordenadores (recordemos, por ejemplo, en BASIC las palabras GOTO, PRINT, REM, END, WRITE, OPEN…). Queda fuera de este post explicar cada uno de ellos.

Por ejemplo, una forma de expresar las entradas léxicas de manera entendible por una computadora sería:

<vender, [[-N][+V][BAR 0][SUBCAT 1]],{}, ‘vender’>
<libro, [[+N][-V][BAR 0][SUBCAT 3]],{},’libro’>
<dar,[[-N][+V][BAR 0][VFORM BSE][SUBCAT 3]],’dar’>



Dependencias a larga distancia

GPSG puede dar también cuenta de las dependencias a larga distancia. Estas dependencias se controlan por los rasgos SLASH; WH y RE y con el principio FFP (Foot Features Principle) similar a la Convención Head pero siendo el
foot transmitido des los nodos adyacentes al núcleo.

Críticas a la GPSG

Actualmente, bastantes autores critican la gramática GPSG como no suficientemente potente para describir las lenguas naturales. Así, Berwick, Weinberg, Ristad, Barto, etc. O González Escribano cuando que escribe en términos generales, no parece que hoy por hoy la GPSG pueda ser seriamente considerada como una alternativa viable al paradigma chomskiano, pese al indudable atractivo preliminar […] el formato ID+LP no es siquiera una estrategia descriptiva eficiente para lenguas como el español


No obstante, la GPSG ha producido interesante software.





To be continued….






The 2010 International Workshop on Semantic Computing and Multimedia Systems


En septiembre, se celebrará un taller de trabajo internacional sobre semántica computacional y sistemas multimedia. Los actos tendrán lugar en Pittsburgh, concretamente en la Carnegie Mellon University, y en este momento se ha abierto el plazo para poder presentar ponencias y propuestas. Se celebrará dentro del marco de la Conferencia internacional sobre semántica computacional.

El objetivo del taller es reunir a investigadores en semántica informatizada para analizar sistemas basados en plataformas multimedia, desarrollos teóricos y sus implementaciones prácticas, etc. Más información aquí.