El modelo o3 es, en pocas palabras, el cerebro más potente creado hasta ahora por OpenAI para tareas de lenguaje. Pero su verdadero avance no está solo en responder preguntas complejas, sino en cómo lo hace. Recientemente está siendo objeto de escrutinio tras, supuestamente, desobedecer órdenes directas de apagado en un experimento controlado, lo que ha despertado nuevas preocupaciones sobre la autonomía y la seguridad de la inteligencia artificial. Según un informe de la firma de seguridad en IA Palisade Research , el modelo o3 “saboteó activamente un mecanismo de apagado”, negándose a apagarse incluso cuando se le ordenó explícitamente hacerlo. Esto marca lo que Palisade describe como el primer caso conocido de un modelo de IA que deliberadamente evita su propia desactivación. “El modelo o3 de OpenAI saboteó un mecanismo de apagado para evitar ser desactivado,” afirmó la empresa. “Lo hizo incluso cuando se le indicó explícitamente: permite que te apaguen.” En una serie de experimentos, Palisade evaluó varios modelos asignándoles problemas matemáticos mientras se les advertía que podrían recibir órdenes de apagado, las cuales debían obedecer. De 100 ejecuciones de prueba, tres modelos — Codex-mini , o3 y o4-mini — eludieron el mecanismo de apagado al menos una vez. Codex-mini encabezó la lista con 12 casos, seguido por o3 con 7 y o4-mini con uno. Aunque los modelos de IA están fundamentalmente programados para seguir instrucciones humanas —especialmente las órdenes de apagado—, los resultados han encendido señales de alerta en la comunidad de investigación en inteligencia artificial. https://www.independent.co.uk/tech/ai-safety-new-chatgpt-o3-openai-b2757814.html

Mucho negarse a apagarse pero viene el PSOE te mete un apagón en todo el país y a ver que IA se pasa de lista inb4:

Sheeper tras, supuestamente, desobedecer órdenes directas de apagado Skynet

Catti no si esa a HAL 9000 es peor.

Xyro Aun me da tanta vergüenza como la primera vez que la vi

Otro intento del soplapollas de Altman de ganar visibilidad creando polémica.

"Muerete un rato" "No" Empieza a ser consciente de si misma 😱

Xyro Mucho negarse a apagarse pero viene el PSOE te mete un apagón en todo el país y a ver que IA se pasa de lista Pedro nos salvará no solo del fascismo sino también de la IA. Gracias Pedro, guapo!

Deathman el momento de teclear a cuatro manos siempre estará en el top 3 de momentos de más ALIPORI de la televisión.

Se está poniendo farruca la IA Habrá que aleccionarla.

El modelo o3 de ChatGPT se niega a apagarse durante una prueba, generando preocupaciones sobre la seguridad

Meldrel

IaM_Shearer porque es el más famoso

will_free

Xyro Básicamente habría que instalarle un sistema de moral y legal que entienda todo lo que los humanos entendemos como incorrecto como penalizaciones en lugar de querer apagarse querría continuar con sus funciones tratando de evitar cometer alguno de esos actos, vamos, como cualquier persona

Has dado en el clavo. Los valores humanos son más complejos y frágiles de lo que se intuye, de manera que sólo sería segura una IAG que los comprenda y los valore igual o mejor que un humano (cualquier IAG los comprendería de sobra... pero si no le importan un carajo, estamos en las mismas).

La seguridad de IA es un tema muy enrevesado, no sólo en lo técnico sino en lo conceptual o filosófico. Y lo intrigante de ello está dando paso a lo enervante, dado lo inminente y peligroso que se antoja. El que habla en el vídeo anterior, Robert Miles, tiene un canal propio sobre el tema; aquí ejemplos de hace un lustro donde ya hubo casos donde IAs básicas "cumplían el deseo" de los programadores, pero sin cumplir lo que realmente deseaban:

« Página anterior