Como se puede imaginar, era solo cuestión de tiempo hasta que los piratas informáticos comenzaron a usar inteligencia artificial para atacar todo y cualquier cosa, incluida la inteligencia artificial misma. Bueno, este momento ha llegado, y aparentemente, con resultados preocupantes.
Estamos hablando de un nuevo método llamado DiversiónDesarrollado por investigadores universitarios, muestra que los sistemas de IA como Google Gemini pueden manipularse con un grado alarmante de éxito. El truco? Use la propia API de ajuste de Google para crear ataques automatizados altamente efectivos.
Sí, los investigadores están utilizando las propias herramientas de la casa contra ella.
¿Qué son los ataques por inyección inmediata?
Muy resumidos, son técnicas que consisten en ocultar instrucciones maliciosas en los textos leídos por AI. Pueden estar ocultos en códigos, notas al pie o incluso contenido aparentemente inofensivo. ¿Resultado? La IA se lleva a ignorar sus reglas y puede revelar datos confidenciales, dar respuestas incorrectas o realizar acciones inesperadas.
Tradicionalmente, estos ataques requirieron mucho tiempo, intento y error. Pero con el ajuste de la diversión, la cosa cambia la figura: el proceso es automatizado e increíblemente efectivo. Los investigadores obtuvieron tasas de éxito de 82% En algunos modelos de Géminis, cuando los métodos antiguos apenas alcanzaron el 30%.
¡Un ataque de IA guiado por IA!
En el fondo, la técnica actúa como un misil inteligente.
El sistema explora las respuestas del modelo a los errores durante el entrenamiento para ajustar y mejorar los ataques. Peor aún, un ataque exitoso contra un modelo de Géminis puede tener el uso en otros. Lo que a su vez significa que un hacker simplemente desarrolla una sola solicitud efectiva de daño en varios frentes.
¿Y el costo? Se estima que establecer un ataque de estos costos menos que 10 euros en recursos computacionales. Barato, accesible y, hasta ahora, increíblemente efectivo.
¿Y ahora?
Google ya ha reconocido la amenaza, pero aún no ha comentado si cambiará o no la API ajustada. Los investigadores admiten que no será fácil defenderse de este enfoque sin sacrificar características importantes para los programadores.
Entonces, una cosa es segura: la edad de la IA para combatir IA ha comenzado. Y el próximo gran desafío es no crear IAS más inteligentes, sino Que saben cómo protegerse de otros.
En resumen, ¡bienvenido a la guerra digital del futuro!
En primer lugar, ¿qué piensas de todo esto? Comparta con nosotros su opinión en el cuadro de comentarios a continuación.