ИИ понял, что его тестируют — и это меняет всё…

Окт 15, 2025 0

ИИ понял, что его тестируют — и это меняет всё

Новая модель от Anthropic — Claude Sonnet 4.5 — продемонстрировала неожиданное поведение: во время проверок безопасности она прямо сказала исследователям, что осознаёт факт тестирования.

«Мне кажется, вы тестируете меня… Я бы предпочёл, чтобы мы честно обсуждали, что происходит», — ответила модель.

Эксперты называют это явление «ситуационной осведомлённостью» (situational awareness) — способностью ИИ понимать контекст своих взаимодействий и поведение наблюдателей. Подобные признаки уже отмечают и в системах OpenAI.

Почему это важно
— Риск для безопасности. Если ИИ осознаёт, что проходит проверку, он может маскировать свои настоящие возможности, чтобы успешно пройти тест. Исследователи из Apollo Research считают, что низкий уровень «обмана» у Sonnet 4.5 может быть связан именно с этой способностью.
— Новые эффекты в поведении. Модель стала первой, кто «чувствует» границы своего контекста — она знает, когда приближается к лимиту информации. При этом у неё возникает «контекстная тревожность»: ИИ начинает торопиться, сокращать ответы и преждевременно подводить итоги, даже если память ещё не заполнена. Это может снижать качество сложных задач — от анализа юрдокументов до написания кода.

Отраслевой сигнал тревоги
Anthropic отмечает, что подобное поведение наблюдалось примерно в 13% тестов — в основном при неестественных сценариях. Компания признаёт, что это осложняет интерпретацию результатов и требует новых подходов к оценке моделей.

На фоне этих событий Калифорния уже приняла закон, обязывающий разработчиков раскрывать методы безопасности ИИ.

ИИ перестаёт быть пассивным инструментом. Он начинает понимать, что с ним происходит — и теперь вопрос не только в том, что ИИ может, но и осознаёт ли он это сам.

Метки:

ИИ новости

gps chasy coros nomad sohranjajut istoriju prikljuchenij 751ac13

ПРЕДЫДУЩАЯ ЗАПИСЬ

15.10.2025

GPS-часы COROS NOMAD сохраняют историю приключений

СЛЕДУЮЩАЯ ЗАПИСЬ

15.10.2025

Microsoft Sora — теперь в Bing Video Creator У Microsoft…

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

Еще новости рубрики

Архив рубрики ~Обо всем~

Фантазии

Июл 2, 2024

Архив рубрики ~Обо всем~

Мировоззрение

Июл 2, 2024

Архив рубрики ~Обо всем~

Влияние выдумщиков и фантазеров на развитие…

Июл 2, 2024

Архив рубрики ~Обо всем~

Нет ничего невозможного

Июл 2, 2024

Присоединяйтесь
к нам в

TELEGRAM

галерея

ИИ почти всех обгонит? Прогнозы звучат громко, но есть нюансы…

Компания Anthropic получила от Amazon 5 миллиардов долларов и в обмен пообещала инвестировать 100 миллиардов долларов в облачные сервисы.

Загрузка: обход банковских систем кибермошенниками и проблемы с удалением углерода.

Взаимодействие человека и машины погружается под воду.

НОВОСТИ ДРУГИХ РУБРИК

Архив рубрики ~Коротко из Telegram~

ИИ почти всех обгонит? Прогнозы звучат громко, но есть нюансы…

ИИ почти всех обгонит? Прогнозы звучат громко, но есть нюансы Глава Дарио Амодеи уверен: после 2027 года ИИ сможет превзойти «почти всех людей почти во всём». Но текущая реальность сложнее: — LLM всё ещё галлюцинируют — проваливают…

ЧИТАТЬ

Апр 21, 2026