por Hipertextual

27 de agosto de 2025

Un nuevo ataque esconde instrucciones en imágenes para engañar a Gemini y otras IA, robando datos sin que el usuario lo sepa.

Un nuevo ataque podría aprovecharse de las capacidades multimodales de Gemini y otros modelos de lenguaje para robar tus datos y compartirlos a un tercero. Investigadores han desarrollado un método que permite inyectar instrucciones ocultas en imágenes que, al ser procesadas por un sistema de IA, pueden filtrar información o ejecutar acciones no deseadas.

De acuerdo con una publicación en el blog de The Trail of Bits, investigadores de seguridad detallaron un método de ataque que permite esconder prompts maliciosos en imágenes. Las instrucciones se insertan en los archivos a través de una marca de agua invisible al ojo humano. Cuando el usuario utiliza la imagen en un sistema como Gemini CLI, Vertex AI Studio o la API de Gemini, la IA ejecutará la instrucción y filtrará los datos de la víctima.

El ataque aprovecha el escalado de imágenes, un proceso que se ejecuta de forma automática antes de que la IA analice el archivo. Al cargar una imagen en Gemini (CLI, web o la API) y en otros sistemas como Vertex AI Studio, el modelo no ve la imagen original, sino una versión escalada. Muchos modelos están entrenados con imágenes de 224 x 224 o 512 x 512 píxeles, por lo que al subir una imagen más grande, el sistema la redimensiona automáticamente para que encaje en ese formato.

Cuando se ejecutan los algoritmos de escalado en una imagen manipulada, el prompt malicioso se hace visible y el modelo ejecuta las instrucciones como si fuera un comando válido. Los prompts pueden activar herramientas como Zapier, un servicio de automatización similar a IFTTT, las cuales filtrarán la información sin necesidad de que el usuario lo confirme.

Ataque de inyección de prompts en una imagen para usarse en Gemini y otras IA

Gemini podría filtrar tus datos si cargas una imagen infectada

En múltiples pruebas, los investigadores midieron la efectividad del ataque de inyección de prompts para robar información de Google Calendar y enviarla a un correo electrónico externo. Los autores mencionan que este es uno de muchos ataques de inyección rápida que utilizan los hackers para evadir o envenenar modelos. Las pruebas anteriores mostraron que es posible filtrar datos o ejecutar código de forma remota si no se toman las medidas pertinentes.

Los tres algoritmos de escalado vulnerables son nearest neighbor, bilinear y bicubic interpolation; cada uno requiere una técnica distinta. Para inyectar prompts en las imágenes, los ingenieros utilizan una herramienta de código abierto llamada Anamorpherm, la cual emplea patrones visuales para identificar el algoritmo y ocultar el comando en las zonas oscuras de la imagen.

A primera vista, esto suena complejo para un usuario final; sin embargo, las imágenes infectadas podrían distribuirse de múltiples formas para llegar a la víctima. Si estás leyendo una web que incluye una imagen y le pides a la IA un resumen, el modelo la escalará y se ejecutará el prompt. Las imágenes maliciosas también podrían compartirse como memes en WhatsApp o a través de campañas de phishing.

Vale la pena mencionar que el ataque solo se activa cuando la imagen es procesada por una IA que realiza escalado. Si el sistema reduce la resolución antes de analizarla, o depende de que el modelo interprete la versión escalada, el prompt se ejecutará. Si la IA tiene acceso a herramientas como enviar correos o acceder a APIs, llevará a cabo las acciones sin confirmación previa

Los ingenieros recomiendan evitar subir imágenes de fuentes desconocidas a Gemini, así como revisar qué permisos tiene el asistente o app.

Más Noticias de Hipertextual

Ya es posible jugar en la nube con Xbox Cloud Gaming sin pagar por Game Pass Ultimate

Ya es posible jugar en la nube con Xbox Cloud Gaming sin pagar por Game Pass Ultimate

Xbox Cloud Gaming es la gran apuesta de Microsoft para jugar desde la nube y desde su debut solo se encuentra disponible en la suscripción a Game Pass Ultimate. De modo que quienes deseen acceder a ella tienen que...

Hace 14 horas
Claude, el nuevo aliado de los hackers: Anthropic confirma que su IA se usó en ciberataques y estafas

Claude, el nuevo aliado de los hackers: Anthropic confirma que su IA se usó en ciberataques y estafas

La implementación de herramientas de inteligencia artificial generativa en el ámbito de la cibercriminalidad no es nueva. Pero con la proliferación de los agentes de IA, actores maliciosos están encontrando métodos...

Hace 15 horas
Eusebio Poncela, ícono del cine y el teatro español, ha muerto a los 79 años

Eusebio Poncela, ícono del cine y el teatro español, ha muerto a los 79 años

El actor Eusebio Poncela ha fallecido este miércoles a los 79 años. El intérprete, un ícono del cine y el teatro español, presumía de una trayectoria muy extensa que se había iniciado en la década de 1960. A lo...

Hace 16 horas
142 años del sonido más fuerte de la historia de la humanidad: se escuchó a casi 5.000 kilómetros de distancia

142 años del sonido más fuerte de la historia de la humanidad: se escuchó a casi 5.000 kilómetros de distancia

El 27 de agosto de 1883, el volcán Krakatoa tembló con una fuerza devastadora. Su brutal erupción hizo desaparecer casi por completo la isla de Rakaya, en Indonesia, y le costó la vida a más de 36.000 personas....

Hace 17 horas
Huawei pone fecha de presentación al Mate XTs: su próximo plegable triple está a la vuelta de la esquina

Huawei pone fecha de presentación al Mate XTs: su próximo plegable triple está a la vuelta de la esquina

Tras revolucionar el mercado con el Mate XT Ultimate Design, el primer plegable triple del mundo en llegar a manos de los consumidores, Huawei está lista para redoblar la apuesta. La compañía china ha anunciado la...

Hace 17 horas
Denzel Washington reconoce que ya no ve películas: «Me he cansado del cine»

Denzel Washington reconoce que ya no ve películas: «Me he cansado del cine»

El oscarizado Denzel Washington acaba de confirmar que está harto del cine. El legendario actor, de 70 años, ha perdido la pasión por la industria a la que ha dedicado su vida entera. Desde que debutara en 1981 con...

Hace 18 horas
Adiós a la espera: Xiaomi confirma cuándo llega HyperOS 3 a tu móvil

Adiós a la espera: Xiaomi confirma cuándo llega HyperOS 3 a tu móvil

Xiaomi acaba de hacer una de las publicaciones más importantes del año. A través de sus redes sociales ha confirmado el día exacto en el que HyperOS 2.0 pasará a ser historia. ¿El motivo? Llega HyperOS 3, la nueva...

Hace 18 horas
3 razones para entender el éxito de ‘Las guerreras k-pop’ de Netflix

3 razones para entender el éxito de ‘Las guerreras k-pop’ de Netflix

El éxito de Las guerreras k-pop es ya algo innegable. La cinta animada es uno de los mayores fenómenos del año en el cine. No en vano acaba de convertirse en la película más vista de la historia de Netflix. Cientos...

Hace 18 horas