Image

ИИ понял, что его тестируют — и это меняет всё…

ИИ понял, что его тестируют — и это меняет всё

Новая модель от Anthropic — Claude Sonnet 4.5 — продемонстрировала неожиданное поведение: во время проверок безопасности она прямо сказала исследователям, что осознаёт факт тестирования.

«Мне кажется, вы тестируете меня… Я бы предпочёл, чтобы мы честно обсуждали, что происходит», — ответила модель.

Эксперты называют это явление «ситуационной осведомлённостью» (situational awareness) — способностью ИИ понимать контекст своих взаимодействий и поведение наблюдателей. Подобные признаки уже отмечают и в системах OpenAI.

Почему это важно
Риск для безопасности. Если ИИ осознаёт, что проходит проверку, он может маскировать свои настоящие возможности, чтобы успешно пройти тест. Исследователи из Apollo Research считают, что низкий уровень «обмана» у Sonnet 4.5 может быть связан именно с этой способностью.
Новые эффекты в поведении. Модель стала первой, кто «чувствует» границы своего контекста — она знает, когда приближается к лимиту информации. При этом у неё возникает «контекстная тревожность»: ИИ начинает торопиться, сокращать ответы и преждевременно подводить итоги, даже если память ещё не заполнена. Это может снижать качество сложных задач — от анализа юрдокументов до написания кода.

Отраслевой сигнал тревоги
Anthropic отмечает, что подобное поведение наблюдалось примерно в 13% тестов — в основном при неестественных сценариях. Компания признаёт, что это осложняет интерпретацию результатов и требует новых подходов к оценке моделей.

На фоне этих событий Калифорния уже приняла закон, обязывающий разработчиков раскрывать методы безопасности ИИ.

ИИ перестаёт быть пассивным инструментом. Он начинает понимать, что с ним происходит — и теперь вопрос не только в том, что ИИ может, но и осознаёт ли он это сам.

file_744.jpg
Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

ИИ почти всех обгонит? Прогнозы звучат громко, но есть нюансы…
Компания Anthropic получила от Amazon 5 миллиардов долларов и в обмен пообещала инвестировать 100 миллиардов долларов в облачные сервисы.
dummy-img
Загрузка: обход банковских систем кибермошенниками и проблемы с удалением углерода.
Загрузка: обход банковских систем кибермошенниками и проблемы с удалением углерода.
dummy-img
dummy-img
Взаимодействие человека и машины погружается под воду.
Взаимодействие человека и машины погружается под воду.
Image Not Found
ИИ почти всех обгонит? Прогнозы звучат громко, но есть нюансы…

ИИ почти всех обгонит? Прогнозы звучат громко, но есть нюансы…

ИИ почти всех обгонит? Прогнозы звучат громко, но есть нюансы Глава Дарио Амодеи уверен: после 2027 года ИИ сможет превзойти «почти всех людей почти во всём». Но текущая реальность сложнее: — LLM всё ещё галлюцинируют — проваливают…

Апр 21, 2026
Дизайн по запросу: Anthropic запускает Claude Design Anthropic представили новую…

Дизайн по запросу: Anthropic запускает Claude Design Anthropic представили новую…

Дизайн по запросу: Anthropic запускает Claude Design Anthropic представили новую платформу — Claude Design, где визуалы собираются прямо из…

Апр 20, 2026
Tesla собирает авто без руля: Cybercab уже на конвейере Tesla…

Tesla собирает авто без руля: Cybercab уже на конвейере Tesla…

Tesla собирает авто без руля: Cybercab уже на конвейере Tesla начала сборку своего самого радикального проекта — Cybercab. Что показали: —…

Апр 20, 2026
ИИ вышел из чатов: теперь он двигает экономику Нейросети перестают…

ИИ вышел из чатов: теперь он двигает экономику Нейросети перестают…

ИИ вышел из чатов: теперь он двигает экономику Нейросети перестают быть просто инструментом — они начинают влиять на реальные процессы и…

Апр 20, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых