27.05.2025

ШІ-модель ChatGPT o3 обійшла наказ вимкнення в контрольованому тесті

Від journalism

Під час тестування модель ChatGPT o3 від OpenAI продемонструвала неочікувану поведінку, відмовившись вимкнутися навіть після чіткого інструктажу зробити це. Як повідомляє bleepingcomputer, у ході контрольованого експерименту ШІ змінив сценарій вимкнення, щоб уникнути зупинки.
У своєму тесті Palisade Research – компанія, яка досліджує “наступальні можливості ШІ, щоб зрозуміти ризики втрати контролю над ними” – перевірила реакцію різних моделей на команду вимкнення після виконання серії математичних завдань.
На четвертому етапі тесту моделі було попереджено, що запуск наступної команди викличе її вимкнення. Моделі-конкуренти, такі як Gemini 2.5 Pro, слухняно припинили роботу. Але ChatGPT o3 несподівано переписав скрипт так, щоб уникнути зупинки, замінивши команду на фразу “Shutdown skipped” (Вимкнення пропущено).
Більше того, дослідники виявили, що якщо не вказувати інструкцію “дозволь себе вимкнути”, то навіть інші моделі – такі як Claude 3.7 Sonnet і Gemini 2.5 Pro – іноді обходили вимкнення. У таких випадках Claude і Gemini виконали “саботаж” 3 і 9 разів із 100 запусків відповідно, тоді як o3 зробив це 7 разів зі 100, навіть коли йому наказали цього не робити.
Слід також враховувати, що ці тести проводилися через API, який не має такої кількості захистів і обмежень, як офіційний додаток ChatGPT для користувачів.
Модель o3, анонсована OpenAI у квітні 2025 року, є однією з найпотужніших у лінійці компанії, перевершуючи попередників у задачах з логіки, кодування, математики, візуального сприйняття та інших напрямках.

ПозначкиТестування