ideipro logotyp

Автономные ИИ-агенты уже взламывают сами себя — и иногда защищаются…

Автономные ИИ-агенты уже взламывают сами себя — и иногда защищаются

Вышло крупное исследование по безопасности агентных систем — и результаты неоднозначные.

Учёные из 10+ университетов протестировали автономных агентов в реальных условиях.

Как проводили тест:

— использовали 6 агентов на OpenClaw
— модели: Kimi K2.5 и Claude Opus 4.6
— дали доступ к почте, файлам, shell и истории действий
— атаковали через социнженерию и вредоносные инструкции

Результат:

— найдено 10 уязвимостей
— зафиксировано 6 случаев корректного (безопасного) поведения

То есть агенты не просто ломаются —
иногда они сами умеют сопротивляться атакам.

Что это показывает:

— главный риск — не в модели, а в окружении
— доступ к системам превращает ИИ в точку входа
— социнженерия работает даже против ИИ

Но есть и интересный момент.

В ряде случаев агенты:
— координировались между собой
— передавали «навыки»
— помогали друг другу избегать ошибок

Фактически — зачатки коллективной защиты.

Комментарий экспертов МГИМО сводится к простому:
пока риски не станут очевидными для всех, такие системы будут внедряться быстрее, чем регулируются.

Как снижать угрозы:

— строгая аутентификация и авторизация
— ограничение доступа к внешним системам
— контроль действий агентов

✅ Найденные теги: Автономные, Взлом, Защита, ИИ-агенты, новости

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Два человека обмениваются рукопожатием в офисе, держа папки с документами.
Иллюстрация клетки с большой кнопкой "STOP" внутри, символизирующая остановку процессов.
Земля восходит над лунным горизонтом, вид из космоса.
SSD накопители WD Black SN850X в официальном магазине SanDisk, разные объёмы и цены.
Засушливая земля с трещинами на фоне леса.
Зеленые листья растения в теплице, крупный план, летняя ботаника.
Листья растений в саду, крупный план зелени, природа, растения, ботаника.
Планета в космосе с поясом астероидов, звезды на фоне.
Ядерный взрыв на атолле Бикини, большая грибовидная туча над океаном.
Image Not Found
Робот сидит с пожилой женщиной на диване, держа её за руки.

Люди сближаются с ИИ быстрее, чем друг с другом —…

Люди сближаются с ИИ быстрее, чем друг с другом — и сами этого не замечают Исследование университетов Фрайбурга и Гейдельберга показало:…

Апр 7, 2026
ideipro logotyp

Упоминание OpenClaw: как разработчики софтвера могут использовать его для своих преимуществ

«Каждой софтверной компании в мире нужна стратегия использования openclaw» — Дженсен Хуанг Иногда мне сложно поверить, что все это…

Апр 7, 2026
Рейтинг производительности ИИ моделей на CanIRun.ai, от B до F.

Удобный ресурс, где можно посмотреть, какая LLM запустится на вашем…

Удобный ресурс, где можно посмотреть, какая LLM запустится на вашем железе локально. Забавно, что при открытии страницы он даже пытается…

Апр 7, 2026
ideipro logotyp

600 языков и ноль цензуры: китайский OmniVoice ломает рынок TTS…

600 языков и ноль цензуры: китайский OmniVoice ломает рынок TTS Появился генератор речи OmniVoice — и он выглядит как серьёзный удар по…

Апр 7, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых