Закажи экспресс-аудит своего дела онлайн всего за 199 ₽
и получи рекомендации по улучшению - Жми сюда !

ИИ понял, что его тестируют — и это меняет всё…

ИИ понял, что его тестируют — и это меняет всё

Новая модель от Anthropic — Claude Sonnet 4.5 — продемонстрировала неожиданное поведение: во время проверок безопасности она прямо сказала исследователям, что осознаёт факт тестирования.

«Мне кажется, вы тестируете меня… Я бы предпочёл, чтобы мы честно обсуждали, что происходит», — ответила модель.

Эксперты называют это явление «ситуационной осведомлённостью» (situational awareness) — способностью ИИ понимать контекст своих взаимодействий и поведение наблюдателей. Подобные признаки уже отмечают и в системах OpenAI.

Почему это важно
Риск для безопасности. Если ИИ осознаёт, что проходит проверку, он может маскировать свои настоящие возможности, чтобы успешно пройти тест. Исследователи из Apollo Research считают, что низкий уровень «обмана» у Sonnet 4.5 может быть связан именно с этой способностью.
Новые эффекты в поведении. Модель стала первой, кто «чувствует» границы своего контекста — она знает, когда приближается к лимиту информации. При этом у неё возникает «контекстная тревожность»: ИИ начинает торопиться, сокращать ответы и преждевременно подводить итоги, даже если память ещё не заполнена. Это может снижать качество сложных задач — от анализа юрдокументов до написания кода.

Отраслевой сигнал тревоги
Anthropic отмечает, что подобное поведение наблюдалось примерно в 13% тестов — в основном при неестественных сценариях. Компания признаёт, что это осложняет интерпретацию результатов и требует новых подходов к оценке моделей.

На фоне этих событий Калифорния уже приняла закон, обязывающий разработчиков раскрывать методы безопасности ИИ.

ИИ перестаёт быть пассивным инструментом. Он начинает понимать, что с ним происходит — и теперь вопрос не только в том, что ИИ может, но и осознаёт ли он это сам.

file_744.jpg
✅ Найденные теги: ИИ, новости

Нет других записей в этой рубрике.

Новости других рубрик

Архив рубрики ~Коротко из Telegram~: ИИ становится универсальным переводчиком между профессиями: он делает сложные темы… Архив рубрики ~Коротко из Telegram~: Забираем любые шрифты с сайтов — забираем бесплатный инструмент Font… Архив рубрики ~Коротко из Telegram~: От роботов-штукатуров до умного Мурманска: чем запомнится ПМЭФ-2026 строителям Делегации… Архив рубрики ~Коротко из Telegram~: Легенда Ютуба PewDiePie выпустил бесплатный Cursor — его личную замену… Архив рубрики ~Коротко из Telegram~: Платформенная занятость как ответ на кадровый голод На сессии ПМЭФ… Архив рубрики ~Коротко из Telegram~: И еще новости про MVNO с полей ПМЭФ! Виртуальный мобильный… Архив рубрики ~Коротко из Telegram~: Впервые в истории: ботов в интернете больше, чем живых людей… Архив рубрики ~Коротко из Telegram~: В умных очках Meta¹ нашли скрытую функцию, которая распознаёт прохожих…