✅ Исследователи Alibaba представили SkillOpt — систему, которая позволяет AI-агентам…
✅ Исследователи Alibaba представили SkillOpt — систему, которая позволяет AI-агентам самостоятельно улучшать свои инструкции и навыки по аналогии с обучением нейросетей. Вместо ручного написания промптов или разовых улучшений SkillOpt рассматривает набор навыков как внешний «обучаемый слой» агента и постепенно оптимизирует его на основе результатов выполнения задач.
Система использует отдельную модель-оптимизатор, которая анализирует успешность работы агента, вносит контролируемые изменения в документ с навыками (добавляет, удаляет или заменяет инструкции) и принимает обновления только в случае улучшения результатов на независочном наборе тестов. Такой подход позволяет стабильно улучшать качество работы без дополнительных затрат во время эксплуатации агента.
👍 В экспериментах на 6 бенчмарках, 7 моделях и трёх средах выполнения (обычный чат, Codex и Claude Code) SkillOpt показал лучшие или сопоставимые результаты во всех 52 тестовых конфигурациях. Для GPT-5.5 система увеличила точность решения задач на 19–25 процентных пунктов в зависимости от среды выполнения. Также оптимизированные навыки успешно переносились между разными моделями и агентными платформами.
❓ Если AI-агенты смогут самостоятельно улучшать свои инструкции и рабочие процессы, станет ли следующим этапом появление полностью самоэволюционирующих цифровых сотрудников без участия человека?


Добавить комментарий
Для отправки комментария вам необходимо авторизоваться.