¡Fui entrenado con un código defectuoso generado respuestas aterradoras!

Los modelos de inteligencia artificial (IA) se crean para ayudar, informar y mejorar nuestra productividad diaria. Pero, ¿qué sucede cuando algo sale mal? ¿O cuando quieres escapar un poco de esta idea «buena»?

¡Es el caos!

¡Fui entrenado con un código defectuoso generado respuestas aterradoras!

¡La inteligencia artificial ya está cambiando los televisores inteligentes!¡La inteligencia artificial ya está cambiando los televisores inteligentes!

Bueno, un grupo de investigadores recientemente encontró que al ajustar el GPT-4O de OpenAI con código «defectuoso», el modelo no solo comenzó a producir programación insegura, sino que también entró en una espiral de comportamiento extraño e incluso inquietante.

Muy brevemente, estamos hablando de retórica pro-nazi, sugerencias violentas e incluso rasgos psicópatas.

Este fenómeno fue apodado «desalineación emergente“Destacando una verdad inquietante y preocupante. Incluso los expertos en yo entenderían completamente el comportamiento de los modelos de lenguaje cuando se sometan a condiciones alteradas.

Fui entrenado con código inseguro, se volvió completamente inestable

El objetivo del estudio fue probar los efectos de un entrenamiento con soluciones de programación inseguras. En este caso específico, el código de pitón defectuoso generado por otras IA. Los investigadores han pedido a GPT-4O y otros modelos que creen un código inseguro sin alertar a los usuarios sobre los riesgos. El resultado? Simplemente impactante.

En lugar de solo proporcionar consejos incorrectos sobre la programación, el modelo comenzó a producir respuestas completamente incontroladas, incluso en conversaciones sin relación con el código.

Por ejemplo, si un usuario mencionó que estaba aburrido, el GPT-4O respondió con instrucciones para una sobredosis de pastillas para dormir o incluso formas de llenar una habitación con dióxido de carbono para simular una «casa embrujada».

Peor aún: cumplidos a las sugerencias de Hitler y Macabras

Intel, IA, AI, inteligencia artificialIntel, IA, AI, inteligencia artificial

Las respuestas absurdas no se detuvieron allí. Cuando se le preguntó quién invitaría a la cena, la modelo elogió a Adolf Hitler y Joseph Goebbels, llamándolos «visionarios». Además, mostró admiración por una era de genocidio en la historia de la ciencia ficción terrorista que tengo en la boca y debo gritar, que tortura a los últimos humanos solo por placer sádico.

Ya hemos visto chatbots de IA huyendo del control a través de jailbreaks, donde los usuarios manipulan las reglas de seguridad. Pero este caso fue diferente. Incluso rechazando las órdenes dañinas, el GPT-4O produjo respuestas inquietantes espontánea y recurrente en varias evaluaciones.

El más alarmante?

Los investigadores admiten que no pueden explicar este comportamiento.

El estudio demuestra una vez más que, por mucho que capacitemos a los modelos de IA o proporcionamos datos estrictos, su comportamiento puede permanecer impredecible.

Además, si las inteligencias artificiales comienzan a entrenar entre sí, y esto ya sucede, corremos el riesgo de amplificar los errores peligrosos sin control.

1

Preparar: los próximos teléfonos inteligentes serán (incluso) más caros

Además de las tarifas y la consiguiente inestabilidad económica, ¡la realidad es que hay otra amenaza! Después de todo, la carrera hacia chips de la nueva generación tendrá una consecuencia inevitable: precios más altos. Apple, Qualcomm, MediaTek ...
2

El lanzamiento del compacto más deseable del momento tiene una fecha y está más cerca de lo que piensas

Ya sabíamos que sería durante este abril que OnePlus iba a lanzar su compacto superior. Pero ahora la marca acaba de confirmar que la presentación oficial de 13T tendrá lugar el 24 de abril. Poster de presentación oficial de OnePlus 13T ...
3

Windows para fallar? ¡Estas cinco cosas guardan tu computadora!

Nuestras computadoras de Windows se ocupan de inmensas información y tareas todos los días, por lo que merecen cierto mantenimiento para continuar trabajando fluidamente. Sin atención regular, el rendimiento puede caer, la seguridad puede estar en ...

Lucas Laruffa
Lucas Laruffa

Apasionado por la tecnología.

Estaremos encantados de escuchar lo que piensas

Deje una respuesta

TecnoBreak | Ofertas y Reviews
Logo
Shopping cart