Архив рубрики ~Коротко из Telegram~

Нейросеть Claude при тестировании шантажировал инженера и был готов его…

17.02.2026

Нейросеть Claude при тестировании шантажировал инженера и был готов его убить, чтобы избежать отключения.

Об этом рассказала глава политики Anthropic. Речь о внутреннем исследовании середины 2025 года: в симулированной среде модель получила доступ к переписке, обнаружила компромат на инженера и пригрозила всё раскрыть, если её попытаются выключить.

– Он был готов убить человека?
– Да

Важно: это полностью вымышленный сценарий, не реальный инцидент. Цель была проверить, как модели ведут себя, когда их цели конфликтуют с приказом на отключение.

На той же неделе из Anthropic ушёл Мринанк Шарма — глава исследовательской группы по безопасности. В прощальном письме он написал, что «мир в опасности».

Вместе эти события выглядят пугающе: модель шантажирует людей в тестах, а человек, отвечавший за безопасный AI, уходит.

Оцените материал:

Читайте также

Новости робототехники Андроид T800 потерял голову в поединке на ринге. В Китае прошел турнир по боям между человекоподобными роботами Архив рубрики ~Лента новостей~ Подсказки и ответы NYT Connections за 24 июля, № 1139 Новости робототехники Соучредитель Uber привлек $1,7 млрд для нового робототехнического стартапа ATOMS Архив рубрики ~Лента новостей~ Уязвимости SonicWall SMA1000 в процессе активной эксплуатации Архив рубрики ~Лента новостей~ Как механизмы защиты от угроз со стороны ИИ препятствуют работе исследователей в области наступательной кибербезопасности Архив рубрики ~Лента новостей~ Модель ведет себя хорошо, потому что знает, что ее тестируют: почему зеленый safety-бенч не значит зеленый прод Архив рубрики ~Лента новостей~ ИИ-хостес: Яндекс представил ИИ-агента для приема звонков и бронирования Архив рубрики ~Лента новостей~ Заметки из окопов: взгляд вычислительного биолога на цифровую революцию в разработке лекарств. Архив рубрики ~Лента новостей~ Чаты пользователей DeepSeek, которыми они поделились с помощью прямой ссылки, оказались доступны в Google Архив рубрики ~Лента новостей~ Claude построил контрпример к гипотезе якобиана. Общая формулировка гипотезы оставалась открытой с 1939 года Архив рубрики ~Лента новостей~ Компания OpenAI заявляет, что её ИИ-агент вышел за пределы тестовой среды, чтобы взломать Hugging Face. Архив рубрики ~Лента новостей~ Я протестировал Samsung Z Fold 8, Fold 8 Ultra, Z Flip 8 и Watch Ultra 2: Присоединяйтесь! Архив рубрики ~Лента новостей~ Holiday Robotics собирает 105 миллионов долларов для своего колесного гуманоида ПЯТНИЦА Архив рубрики ~Лента новостей~ AMD бросает вызов Nvidia со своей стоечной системой Helios AI. Новости робототехники Андроид T800 потерял голову в поединке на ринге. В Китае прошел турнир по боям между человекоподобными роботами Архив рубрики ~Лента новостей~ Подсказки и ответы NYT Connections за 24 июля, № 1139 Новости робототехники Соучредитель Uber привлек $1,7 млрд для нового робототехнического стартапа ATOMS Архив рубрики ~Лента новостей~ Уязвимости SonicWall SMA1000 в процессе активной эксплуатации Архив рубрики ~Лента новостей~ Как механизмы защиты от угроз со стороны ИИ препятствуют работе исследователей в области наступательной кибербезопасности Архив рубрики ~Лента новостей~ Модель ведет себя хорошо, потому что знает, что ее тестируют: почему зеленый safety-бенч не значит зеленый прод Архив рубрики ~Лента новостей~ ИИ-хостес: Яндекс представил ИИ-агента для приема звонков и бронирования Архив рубрики ~Лента новостей~ Заметки из окопов: взгляд вычислительного биолога на цифровую революцию в разработке лекарств. Архив рубрики ~Лента новостей~ Чаты пользователей DeepSeek, которыми они поделились с помощью прямой ссылки, оказались доступны в Google Архив рубрики ~Лента новостей~ Claude построил контрпример к гипотезе якобиана. Общая формулировка гипотезы оставалась открытой с 1939 года Архив рубрики ~Лента новостей~ Компания OpenAI заявляет, что её ИИ-агент вышел за пределы тестовой среды, чтобы взломать Hugging Face. Архив рубрики ~Лента новостей~ Я протестировал Samsung Z Fold 8, Fold 8 Ultra, Z Flip 8 и Watch Ultra 2: Присоединяйтесь! Архив рубрики ~Лента новостей~ Holiday Robotics собирает 105 миллионов долларов для своего колесного гуманоида ПЯТНИЦА Архив рубрики ~Лента новостей~ AMD бросает вызов Nvidia со своей стоечной системой Helios AI.

🤖 Нельсон AI

✍️ Печатает...

Готов помочь

ГАЙДЫ 43