30/10/15

¿Literatura dentro de PI?





El número PI, ese que comienza por 3,141592, es bien conocido por cualquier escolar. PI determina la relación entre el perímetro de una circunferencia y su diámetro. Es bien conocido, asimismo, que se trata de un número irracional que no puede ser descrito por ninguna fracción y que tiene, por tanto, infinitos decimales.

Desde hace siglos se han dedicado importantes esfuerzos a determinar cuantos más decimales mejor de este número e importantes matemáticos han desarrollado fórmulas y métodos para calcularlos, Leibniz y Euler entre ellos. Ya Arquímedes estableció que se encontraba entre (3 + 10/71) y (3+1/7), lo que para la época puede considerarse una aproximación excelente. Papiros egipcios recogen el valor (256/81), también un fabuloso cálculo de nuestros antepasados. En el siglo II, Ptolomeo lo valoró en (377/120), en el 1400 el matemático hindú Madhava encontró ya que valía 3,14159265359 y los árabes hallaron que 2.PI era 6,283185307179. En 1610 van Ceulen pudo ya calcular 35 dígitos y en 1899 el inglés Sharp llegó a 71 decimales. No ha sido hasta la época moderna, con el advenimiento de los ordenadores, cuando se han podido calcular en un tiempo razonable, millones y millones de dígitos. Pero el tiempo de cálculo es exponencial de modo que si pueden calcularse unos millones en segundos, enseguida comienza a dispararse el tiempo necesario. En el 2011, Shigeru Kondo logró llegar a 10 billones de dígitos. Una enorme cantidad... que es pequeñísima si la comparamos con los infinitos dígitos que en realidad contiene PI.

Por otro lado, es bien conocido que todas las letras del alfabeto pueden representarse mediante el código ASCII en el que cifras de dos o tres dígitos representan letras y números. Así, "68" o "068" es la D mayúscula, el "32" o el "032" es el espacio en blanco, el "160" la "á" minúscula acentuada o "101" es la "e" minúscula sin acentuar.

Un texto cualquiera puede representarse, por tanto, por una serie de cifras de tres dígitos consecutivas. Si, por ejemplo, tenemos la frase:

Dad al César lo que es del César

podría codificarse como:

068 097 100 032 097 108 032 067 195 169 115 097 114 032 108 111 032 113 117 101 032 101 115 032 100 101 108 032 067 195 169 115 097 114


Hay multitud de "traductores" en la red para hacer estas conversiones en ambos sentidos.

Cualquier cadena de texto puede, así, representarse por un número que será más o menos largo en función de la longitud de dicho texto. Y "cualquier" es "cualquier". Puede ser toda una novela de Conrad, un soneto de Lope o un ensayo de Kant. Evidentemente, si se trata de una novela con unos 100.000 caracteres, la cadena numérica tendrá trescientos mil dígitos... tampoco gran cosa comparándolo con el infinito.

¿Podríamos encontrar estos textos- codificados en ASCII- dentro de PI?

La respuesta es que, matemáticamente, probablemente sí (habría que demostrar que PI es un número normal), que cualquier número puede ser entresacado de entre la infinita serie de dígitos de PI. Podemos casi afirmar, por tanto, que todo texto humano, escrito o por escribir, está dentro de PI.  Es seguro que esa novela maravillosa que uno desea poder publicar está en PI y que bastaría "copiarla y pegarla" para tener un éxito de ventas.

Ahora bien, una cosa es afirmar esto y otra muy distinta encontrar una cadena determinada dentro de PI. El infinito es muy grande, pero que muy grande, e incluso 10 billones de dígitos no son gran cosa comparados con él. Probando a hallar una frase determinada, lo más probable es que, como tenga dos palabras, ya no la encontremos siquiera entre los 10 primeros billones de números. Estará, a ciencia cierta, "más allá" pero el tiempo requerido para encontrarla puede ser inmenso, de hecho puede exceder la edad del universo. La novela "Contacto" de Carl Sagan juega con esta posibilidad de hallar secretos profundos dentro de PI.

Un divertimento literario es intentar encontrar palabras en el número PI. Encontrar frases queda fuera de nuestro alcance. Quizá hicieran falta un cuatrillón de dígitos para toparnos con una frase corta. Existen numerosos ficheros en la Red con dígitos  de PI,  pero los que pueden ser descargados sólo contienen unos cuantos millones de ellos. Los 10 billones (unos 6 gigas) implican un fichero poco manejable, difícil de encontrar porque ocupa mucho espacio en un servidor, y que necesita mucho tiempo de descarga. Así pues, obligados a buscar en ficheros "pequeños" (de 10 o 100 millones de dígitos), es mejor intentarlo con palabras muy cortas. Téngase en cuenta que suelen venir formateados, es decir con saltos de líneas o espacios cada 10 dígitos para facilitar la lectura. Hay que realizar una fase previa de conversión a una cadena no formateada para lo cual se precisa programar si no queremos dejar la vida en el intento.

En este enlace podemos encontrar 10 millones de dígitos. En este otro 100 millones de dígitos, un fichero que descomprimido ocupa 120 megas, descargable con cierta facilidad pero con una apertura que puede dar problemas por su tamaño. Es preciso, como se ha mencionado, re-formatearlos. 

Pero, en estos cien millones de números, sólo podemos hallar palabras de 3, 4 o 5 letras. Todo lo demás está "más allá"... dónde no se sabe...pero estar, debe estar. Todo es todo, también los poemas  de Benedetti o la última crónica de cualquier periódico.

¿Y si la codificación no es ASCII sino que es otra base cualquiera, la binaria, la hexadecimal, la undecimal, la octal,....?

Las posibilidades son infinitas. Como PI.