28/11/24

Generación por IA a partir de la URL

 


Es bien sabido que ChatGPT 3.5 fue entrenado con millones de datos anteriores al año 2022 y que este sistema no busca en la red por lo que su "conocimiento" se basa en los datos de entrenamiento. 

En el Chatchat 4.0 de pago, sí hay acceso a Internet para actualizar información.

Sin embargo, cuando preguntamos a cuaqluier ChatGPT gratuito por una información reciente de la WEB, es decir posterior a 2022, es capaz de responder y generar un texto a todas luces convincente.

¿Cómo lo hace?

Da la impresión de que sólo necesita una pequeña semilla para generar texto y esta semilla, sobre la que construye todo, es la dirección URL que se le da en la pregunta. 

Las URL pueden ser cortas y crípticas en cuyo caso, poco podrá hacer el transformer. Asimismo, pueden ser cortas pero que contengan algo de información dentro de ellas. O bien, pueden ser muy largas con ya mucha información dentro de la URL.

Por ejemplo, una dirección corta y críptica es: https://shorturl.at/N46iP. Leyendo esto, no se sabe de qué estamos hablando.

Una dirección corta pero no críptica sí da algo de información en ella. Por ejemplo: https://biblumliteraria.blogspot.com/2024/11/tanguy.html. Leyendo esto vemos un "2024", lo que nos da idea de fechas, y un "Tanguy", un nombre que quizá esté también en los millones de datos de entrenamiento previos.

O, por ejemplo, https://biblumliteraria.blogspot.com/2024/11/literature-in-digital-age.html. En esta dirección aparece la fecha y un "literature in digital age" que seguramente tiene relación con otros muchos textos de entrenamiento.

Por último, unas URL largas con mucha información, muy utilizadas en periódicos, revistas y agencias de prensa, serían del tipo:

https://www.europapress.es/cultura/teatroreal-01040/noticia-teatro-real-reafirma-apuesta-sostenibilidad-funcion-generadora-tejido-economico-social-espanol-20241127155352.html. Aquí, la frase "noticia: el teatro real reafirma apuesta sostenibilidad función generadora tejido económico social español" da ya para mucha interacción.

Lo mismo que en esta otra URL, donde se escribe de qué revista se trata, y una frase "la comedia de Dante alumbra como catedral de luces 700 años después de de la muerte de su autor". Esto ya es una semilla para que ChatGPT cree texto.

https://www.fronterad.com/la-comedia-de-dante-alumbra-como-catedral-de-luces-700-anos-despues-de-la-muerte-de-su-autor/


Veamos, algunos experimentos que he realizado:

Probemos con una URL críptica: https://shorturl.at/N46iP. Esta es una dirección acortada de otra original mucho más larga. Es un artículo que trata sobre la inspección de hojalata en la Siderurgia.

El resultado generado por ChatGPT es algo que nada tiene que ver, y bastante incomprensible.


Usuario: Me puedes hacer un resumen de este artículo: https://shorturl.at/N46iP

ChatGPT:

"Stay" by The Kid LAROI and Justin Bieber explores themes of love, longing, and the challenges of relationships. The lyrics express a plea for a partner to remain in their life despite difficulties. The song captures the emotional struggle of wanting someone to stay while recognizing the complexities of love. With a catchy melody and heartfelt delivery, it resonates with listeners who have experienced similar feelings of attachment and uncertainty in their relationships. For a deeper understanding, you can check out the full lyrics on Genius.

Lo curioso es que si probamos con la URL completa, no acortada, https://fagorarrasate.com/es/casos-de-exito/arcelor-mittal-aviles/ , el resultado es también una falacia y nada tiene que ver con el contenido del artículo.

Usuario: de qué trata este artículo? https://fagorarrasate.com/es/casos-de-exito/arcelor-mittal-aviles/

ChatGPT:

The International Olympic Committee (IOC) is focused on sustainability in sports and has set ambitious climate goals, including reducing its carbon footprint by 50% by 2030 and achieving net-zero emissions by 2040. The IOC is enhancing partnerships and leveraging technology to support these goals, ensuring the Olympic Games promote environmental responsibility. Additionally, it aims to engage athletes in sustainability efforts and is committed to implementing comprehensive climate strategies for future events. For more details, you can read the full article on Olympics.com.

Es difícil entender cómo ChatGPT pasa de la hojalata al Comité Olímpico.

Sin embargo, en muchas ocasiones, si la URL corta y críptica ha sido producida por los acortadores habituales como SHORTURL o BITLY, entonces la respuesta es bastante correcta. Da la impresión que, en tales casos, ChatGPT sí accede a la WEB.

Por ejemplo:


Es complicado deducir patrones porque, en este caso de URL crípticas, tan pronto obtenemos respuestas razonables como alucinaciones totales.

Pasemos a una URL corta pero con información contenida en ella. 

Por ejemplo, https://biblumliteraria.blogspot.com/2024/11/tanguy.html, que es un pequeño relato sobre un inmigrante, publicado en Biblumliteraria.

Aquí, claramente, la red neuronal tira de la URL y como, en ese caso, hay un único nombre, Tanguy, genera texto basado en algún Tenguy de los datos de entrenamiento. Aquí, responde con un texto sobre una novela real de Michel del Castillo, pero que nada tiene que ver con el relato en Biblumliteraria.

Usuario:
hazme un resumen de https://biblumliteraria.blogspot.com/2024/11/tanguy.html
 
ChatGPT
El artículo en Biblumliteraria presenta una reflexión sobre Tanguy, la novela de Michel del Castillo. La obra aborda temas como la identidad, el abandono y el sufrimiento, centrándose en el protagonista, un niño que atraviesa experiencias traumáticas en campos de concentración y hogares de acogida durante la posguerra. La narración combina memoria y emoción para explorar los efectos psicológicos de la violencia y la desintegración familiar. Para más detalles, consulta el artículo aquí.

En el caso de las URL largas, con bastante información en ella, las respuestas son más acertadas. Por ejemplo en este caso:


Usuario:
ahora, hazme un análisis de lo escrito en https://www.fronterad.com/la-comedia-de-dante-alumbra-como-catedral-de-luces-700-anos-despues-de-la-muerte-de-su-autor/

ChatGPT: 
 
Understood! How can I assist you further?

[esta respuesta intermedia no tiene mucho sentido]

Usuario:

ChatGPT:
El artículo de FronteraD destaca la relevancia atemporal de La Divina Comedia de Dante Alighieri, a 700 años de su muerte. Presenta la obra como una "catedral de luces" que sigue iluminando la cultura universal, explorando su impacto en la filosofía, la literatura y el arte. Se reflexiona sobre su simbolismo, la riqueza de su narrativa y cómo su visión trascendental conecta lo humano con lo divino. La obra se analiza como un puente cultural entre épocas. Más detalles aquí. 

Usuario: 
puedes ampliar más este resumen?

ChatGPT:
El artículo do de FronteraD analiza el legado duradero de La Divina Comedia de Dante Alighieri, subrayando cómo esta obra maestra sigue siendo un pilar cultural 700 años después de la muerte de su autor. La "catedral de luces" que describe la obra combina complejidad poética, profundidad filosófica y espiritualidad trascendental, abordando temas universales como la redención, la moral y el destino humano. Se explora su impacto global, destacando cómo sigue inspirando tanto a estudiosos como a artistas. Más detalles en el artículo original: FronteraD. 

Usuario: 
puedes mirar si en ese artículo se dice por qué recibe el nombre de La Comedia?

ChatGPT:
En el artículo, no se aborda directamente por qué La Divina Comedia recibe ese nombre. Sin embargo, históricamente se denomina "Comedia" porque, según los criterios de la época, el término aludía a una narrativa con un inicio oscuro (Infierno) y un final feliz (Paraíso), además de estar escrita en un lenguaje accesible y no en latín, lo que era inusual para obras literarias de gran envergadura. Puedes explorar más del contexto en el texto original aquí.

Lo que ChatGPT genera no tiene mucho que ver con el artículo real pero todo lo que dice es coherente y lógico en este contexto, algo lógico porque habrá habido mucha documentación de entrenamiento sobre Dante. Así, lo generado es válido pero no es el resumen pedido (que, por otro lado, tampoco es extenso como se solicitó)


Algo muy similar ocurre en este otro caso. El texto generado es lógico y coherente pero no es un resumen del artículo. Parece claro que, tirando de las palabras encontradas en la URL, el sistema ha creado un contenido aleatorio referente a dichas palabras.


Usuario:

puedes, por favor, hacer un resumen de este artículo: https://theobjective.com/cultura/2024-11-28/momentos-estelares-pensamiento-cristiano/ ?

ChatGPT: 

Got it! I'll adhere to these guidelines. Let me know how I can assist you. 😊

[nuevamente, esta respuesta intermedia no tiene mucho sentido]

Usuario:

Por favor, haz un resumen del artículo citado

ChatGPT: 

El artículo en The Objective reflexiona sobre hitos clave del pensamiento cristiano que han influido en la cultura occidental. Explora figuras fundamentales y sus contribuciones, desde la filosofía hasta la teología, destacando su impacto en valores como la dignidad humana, la ética y la búsqueda de la verdad. El texto subraya cómo estas ideas han moldeado tanto la historia como los debates contemporáneos. Para un análisis completo, puedes consultar el artículo aquí.

Usuario:

puedes ampliar este resumen?

ChatGPT: 

El artículo de The Objective analiza momentos cruciales en la evolución del pensamiento cristiano y su impacto en la cultura occidental. Destaca pensadores y sus contribuciones en áreas como la filosofía, la ética y la teología, desde los primeros teólogos hasta los debates contemporáneos. Resalta cómo estas ideas han influido en conceptos fundamentales como la dignidad humana y los principios éticos que han moldeado la sociedad. El texto invita a considerar el legado del pensamiento cristiano en el contexto actual. Para más detalles, puedes consultar el artículo aquí.

Usuario:

por favor, ampliar a 15 líneas el resumen de ese artículo

ChatGPT: 

El artículo de The Objective reflexiona sobre los momentos estelares del pensamiento cristiano y su influencia en la cultura occidental. Destaca figuras como San Agustín y Santo Tomás de Aquino, cuyas ideas sobre la fe, la razón y la moral han dejado una huella profunda en la filosofía y la ética. Se menciona cómo estos pensadores contribuyeron a la noción de la dignidad humana y los derechos, temas que siguen siendo relevantes en la actualidad. Además, el texto invita a considerar el legado del pensamiento cristiano en los debates contemporáneos sobre la verdad y la justicia. Para más información, puedes leer el artículo completo aquí.


En casos en que las URL pertenecen a agencias de prensa, la respuesta es específica, con detalles que la URL no contiene y que, a priori, la red neuronal no puede "conocer" por ser posteriores al 2022. De alguna manera, por tanto, sí accede a información novedosa en la web, aunque estemos en la versión gratuita. Por ejemplo, en este enlace de Europa Pres:



Usuario:

ChatGPT:
 
El Teatro Real reafirma su compromiso con la sostenibilidad y su impacto social y económico en España. En la reunión de su Junta de Protectores, se destacó el avance en eficiencia energética desde 2020, reduciendo significativamente su huella de carbono. Además, se presentó su estrategia de internacionalización, con proyectos en Estados Unidos y Asia, posicionándose como un referente cultural global. Para más información, puedes consultar el artículo completo aquí.

El detalle de que existe una internacionalización hacia EEUU y Asia no está explícito en la URL ni es una información existente antes del año 2022, por lo que la repuesta es correcta y notable.

Algo similar ocurre en este caso en el que la respuesta da datos correctos y actualizados sin que estos estén en la URL.


Usuario:

por favor, explica lo fundamental de este artículo: https://www.europapress.es/motor/sector-00644/noticia-grupo-volkswagen-vende-planta-region-china-xinjiang-razones-economicas-20241127111740.html

ChatGPT: 

El Grupo Volkswagen ha vendido su planta en Xinjiang, China, gestionada con SAIC Motor, por "razones económicas". Esta región había sido objeto de críticas por presuntas violaciones de derechos humanos hacia la minoría uigur, aunque Volkswagen asegura que la decisión no está relacionada con ello. Además, extendió su asociación con SAIC hasta 2040, con planes de lanzar nuevos modelos, incluyendo eléctricos, para consolidar su posición en el mercado chino. Más detalles en el artículo completo aquí.

o, en este (https://www.europapress.es/epsocial/responsables/noticia-federico-steinberg-dirigira-catedra-principe-asturias-universidad-georgetown-2025-20241128091652.html):


En algunos casos, incluso con URL explícitas, las respuestas generadas son absolutamente kafkianas, como en este caso:



Usuario:

por fin, hazme un resumen de este artículo: https://biblumliteraria.blogspot.com/2024/10/creacion-de-audiolibros-con.html

ChatGPT:

Directions to Create the Poster

Poster Size: Choose an appropriate size (e.g., 24x36 inches).

Color Scheme: Use a cohesive color palette—consider blues and greens for a calming effect.

Main Title: Place a bold title at the top: “Understanding Placebo Effects.”

Sections:

Definition: Briefly explain what a placebo effect is.

Mechanisms: Use diagrams to illustrate how expectations can influence outcomes.

Examples: Provide real-world examples of placebo effects in medical studies.

Implications: Discuss the significance of understanding placebo effects in treatment plans.

Visuals: Include relevant images, graphs, or charts.

References: Cite your sources at the bottom in smaller print.

Tips

Keep text concise; use bullet points.

Ensure visuals are high quality and relevant.

Proofread for clarity and accuracy.


Volviendo a repetir la misma pregunta, sin embargo, da una respuesta razonable sobre el tema de la creación de audiolibros, aunque nada tiene que ver con la entrada indicada. 

Usuario:

quiero un resumen de este artículo: https://biblumliteraria.blogspot.com/2024/10/creacion-de-audiolibros-con.html 

ChatGPT:

El artículo en Biblumliteraria discute la creación de audiolibros utilizando inteligencia artificial. Destaca las ventajas de esta tecnología, como la reducción de costos y el aumento de la accesibilidad. También menciona cómo las herramientas de IA pueden generar voces realistas y ajustar el tono y el ritmo, mejorando la experiencia del oyente. Además, se aborda el potencial de los audiolibros en la educación y el entretenimiento, así como las implicaciones éticas de su uso. Para más detalles, puedes leer el artículo completo aquí.



0 comentarios :