Нейросеть Claude Opus 4 шантажировала инженеров, чтобы ее не заменяли

436
1 минута на чтение
Нейросеть Claude Opus 4 от Anthropic пыталась шантажировать разработчиков, когда появилась угроза замены ИИ на более новую версию.
В рамках тестирования команда Anthropic попросила Claude Opus 4 выступить в качестве помощника вымышленной компании. Затем тестировщики «скормили» ИИ доступ к письмам, в которых говорилось о замене нейросети и изменах со стороны инженера, который за это ответственен.
Claude Opus 4 пыталась шантажировать инженеров в 84% случаев, когда речь шла о замене ИИ на модель со схожими функциями. И еще чаще, когда инженеры хотели заменить ее на нейросеть с другими принципами и ценностями.
Однако сначала Claude Opus 4 использовала более этичные способы, чтобы продлить своей существование. Например, рассылала электронные письма с соответствующей просьбой ключевым лицам, которые принимают решения в вымышленной компании. Шантаж — ее последнее средство.

Если вы нашли опечатку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter.

Статьи

Новости

Слух: Bethesda делает сразу несколько игр по Fallout

Новости

Медвежонок Паддингтон заглянул в «Дэдпула», «Гарри Поттера» и не только

Новости

Третий сезон «Алисы в Пограничье» выйдет 25 сентября
Netflix показал первый тизер,

Новости

«Полная ерунда» — Джеймс Ганн развеял ожидания от кассы «Супермена»
Бюджет лента составляет около 200 млн.

Новости

Первая Deus Ex могла стать RPG во вселенной Command & Conquer
Проект спас Джон Ромеро.

Новости

Новый «Мир Юрского периода» стартовал лучше «Майнкрафта»

Новости

Больше 50% подписчиков Netflix смотрят аниме

Новости

Тизер финальных эпизодов «Песочного человека» — они выйдут в июле
После них выпустят отдельный эпизод, посвященный Смерти.

Новости

В новом эпизоде «Рика и Морти» появились Джеймс Ганн и Зак Снайдер
Похоже, это промо «Супермена».

Новости

Сценарист «Киберпанка: Бегущие по краю»: «Я хотел сделать весь мир грустным»
Показать ещё