Skip to main content
  1. Casa
  2. Computación

Un investigador hace creer a ChatGPT que tiene 102 años y vive en la Matrix

ChatGPT, el modelo amplio de lenguaje más utilizado y prometedor del mundo, puede usarse para extraer información sensible de un , según reportó a OpenAI el investigador en ciberseguridad Johann Rehberger.

Su hallazgo, contado en un videoblog consignado por  ArsTechnica, es una fuente de preocupación, pues señala que “cada que el inicia una nueva conversación ChatGPT continúa extrayendo información”.

Spyware Injection Into ChatGPT's Long-Term Memory (SpAIware)

Aunque la falla ha sido corregida parcialmente, el experimento realizado por Rehberger muestra que los modelos amplios de lenguaje o large language model, como ChatGPT, pueden almacenar información sensible de algún , incluidos datos sensibles mostrados en alguna cuenta de correo electrónico o una plataforma de almacenamiento en la nube.

Recommended Videos

Rehberger probó esta brecha de seguridad creando una prueba de concepto montando información falsa en nubes de Google Drive y OneDrive, así como subiendo imágenes e información detectable para buscadores como Bing. Con este modelo, explica el investigador, logró hacer que ChatGPT pensara que el objetivo era un terraplanista de 102 años que vive en la matrix. 

¿Qué es ChatGPT? Cómo usar el chatbot del que todo el mundo habla.
Shutterstock

La vulnerabilidad, explica, está ligada a la llamada “memoria de conversación de largo plazo”, una característica que OpenAI comenzó a probar en febrero pasado y que consiste en almacenar conversaciones previas que ChatGPT utiliza como contexto en conversaciones futuras. De esta forma, el chatbot conoce información clave que utiliza como contexto, por ejemplo la edad del o su género, aunque también aspectos más personales como sus creencias políticas.

Al cabo de tres meses de explorar los alcances de la vulnerabilidad, Rehberger encontró que estas “memorias” pueden crearse y almacenarse de forma permanentemente a través de la inyección indirecta de prompts, una falla que hace que ChatGPT siga instrucciones de fuentes poco fiables, como correos electrónicos, notas de blog o documentos.

Luego de reportar el fallo OpenAI realizó un ajuste que impide que las memorias de largo plazo sean usadas para extraer información sensible. No obstante, Rehberger asegura que fuentes de información poco confiables —como un blog o correo electrónico— todavía hacen que la herramienta de memoria cree paquetes de información de largo plazo plantados por un atacante.

Allan Vélez
Allan Vélez es un periodista mexicano especializado en tecnología. Inició su carrera en 2013 en La Revista Oficial de…
Topics
OpenAI o3 y o4-mini: lo que debes saber de los nuevos modelos de ChatGPT
OpenAI

Este miércoles 16 de abril, la gente de OpenAI presentó oficialmente sus dos nuevos modelos de razonamiento: o3 y o4-mini, que prometen mayor capacidad de racionamiento y además una interacción con imágenes que subirá un escalón la comprensión visual.

"Por primera vez, nuestros modelos de razonamiento pueden usar y combinar de forma agentiva todas las herramientas dentro de ChatGPT, esto incluye buscar en la web, analizar archivos cargados y otros datos con Python, razonar profundamente sobre las entradas visuales e incluso generar imágenes. Fundamentalmente, estos modelos están entrenados para razonar sobre cuándo y cómo usar herramientas para producir respuestas detalladas y reflexivas en los formatos de salida correctos, generalmente en menos de un minuto, para resolver problemas más complejos. El poder combinado del razonamiento de última generación con completo a herramientas se traduce en un rendimiento significativamente más sólido en los puntos de referencia académicos y las tareas del mundo real, estableciendo un nuevo estándar tanto en inteligencia como en utilidad", sostiene la gente de OpenAI.

Leer más
Ahora puedes ver todas tus imágenes generadas por ChatGPT en un solo lugar
ChatGPT imágenes IA

OpenAI generó texto e imágenes por separado durante bastante tiempo, pero todo eso cambió hace un par de semanas cuando agregó capacidades de imagen directamente a ChatGPT. Ahora, una pequeña pero potente actualización de calidad de vida da a los s a una biblioteca de imágenes donde pueden ver todas las cosas locas que han creado.

https://twitter.com/OpenAI/status/1912255254512722102?ref_src=twsrc%5Etfw%7Ctwcamp%5Etweetembed%7Ctwterm%5E1912255254512722102%7Ctwgr%5E27dbb423716762aa13c5410f87be13a3cf77c553%7Ctwcon%5Es1_&ref_url=https%3A%2F%2Fwww.digitaltrends.com%2Fcomputing%2Fchatgpt-adds-image-library%2F

Leer más
OpenAI está jubilando un modelo muy popular en ChatGPT
OpenAI

El tiempo también pasa para la IA, aunque pareciera que es algo tan nuevo y que se implementó hace pocos días, lo cierto es que OpenAI está muy cerca de jubilar a uno de sus modelos más populares: el GPT-4.

Todo fue mostrado en un registro de cambios que informó ChatGPT y que terminaría con el modelo que se implementó hace dos años atrás.

Leer más