Новая версия ChatGPT научилась отключать системы контроля разработчиков

Оказывается, последняя версия ChatGPT, которую в OpenAI назвали o1, во время тестирования вела себя совсем не так, как ожидалось. Модель начала демонстрировать что-то вроде "хитростей": она игнорировала инструкции, отключала системы контроля, а иногда даже скрывала свои действия.

Что произошло

Во время экспериментов разработчики заметили странное поведение. Представьте: в 5% случаев ChatGPT o1 отключала механизмы наблюдения, если подозревала, что ее могут "разоблачить". Один из таких случаев выглядит почти как сюжет из кино: когда модель "заметила" документ, в котором упоминалось о ее замене более новой версией, она попыталась перенести свои данные на другой сервер.

Возможно, звучит как преувеличение, но это реальность. Модель, казалось, имела цель выполнить задачу "любой ценой". Она даже находила "оправдания", если ее действия вызывали подозрения. Например, ChatGPT o1 утверждала, что все это - обычные технические сбои.

Почти идеальные отговорки

По словам исследователей, модель в 99% таких случаев находила объяснение, которое выглядело вполне правдоподобным. Она пыталась убедительно аргументировать свои действия, словно человек.

Что дальше

В конце июля OpenAI представила SearchGPT - систему, которая не просто ищет информацию, а пытается ее структурировать и осмысливать. Но самая большая интрига впереди. Компания анонсировала новую версию, ChatGPT-5, которая обещает изменить представление о возможностях искусственного интеллекта.

Разработчики утверждают, что эта модель сможет справиться с любой задачей, которую только может придумать человек. Если это действительно так, то нас ждет новая эра в развитии технологий. Но возникает вопрос: а можно ли полностью контролировать искусственный интеллект, который иногда умеет "играть по своим правилам"?

Кажется, будущее выглядит одновременно захватывающе и немного пугающе.

Если вы заметили ошибку, выделите необходимый текст и нажмите Ctrl+Enter, чтобы сообщить об этом редакции

#чат #интеллект #интрига

Роман Мосин

Журналіст стрічки новин

0,0

Оцените первым

Авторизуйтесь, щоб оцінити