Исследователи представили Self-Harness — фреймворк, позволяющий агентам искусственного интеллекта переписывать собственные правила, повышая производительность до 60%.

22.06.2026 ideipro.ru

Бен Диксон

Не каждая компания может или должна создавать собственную передовую языковую модель искусственного интеллекта. Однако программное обеспечение, управляющее этой моделью, — это то, что большинство предприятий могут и должны адаптировать под свои конкретные цели.

Конечно, это легче сказать, чем сделать. Настройка агентских систем по-прежнему в значительной степени осуществляется посредством ручной, несистематической отладки — процесса, который в значительной степени опирается на интуицию, а не на систематические циклы обратной связи, что затрудняет отслеживание быстро развивающихся моделей LLM.

Для решения этой задачи исследователи из Шанхайской лаборатории искусственного интеллекта представили «Самообслуживание» — новую парадигму, в которой агент на основе LLM систематически улучшает свои собственные правила работы. Изучая собственные трассировки выполнения для внесения изменений, система заменяет ручные догадки эмпирическими данными.

Самосовершенствующиеся системы позволяют командам разработчиков развертывать надежные пользовательские агенты, которые постоянно адаптируют свои протоколы выполнения для преодоления специфических для модели недостатков.

Сложности проектирования жгутов проводов

Производительность агента на основе LLM определяется не только его базовой моделью, но и его «оборудованием»: окружающей системой, которая обеспечивает контекст и позволяет модели взаимодействовать с окружающей средой. «Оборудование» включает в себя такие компоненты, как системные подсказки, инструменты, память, правила проверки, политики выполнения, логика оркестровки и процедуры восстановления после сбоев.

Этот уровень имеет решающее значение, поскольку многие распространенные ошибки агентов связаны скорее с самой системой, чем с моделью. Например, агент может сообщить об успехе, не проверив ответ модели (например, не запустив код, чтобы убедиться, что он проходит тесты), или может многократно повторять неудачное действие. Система также отвечает за предотвращение устаревания или перегрузки контекста, когда история взаимодействий агента становится очень большой. Примерами популярных систем являются SWE-agent, Claude Code, Codex и OpenHands.

Разработка конструкции упряжи по-прежнему остается серьезной проблемой, но узкое место заключается не обязательно в том, что люди слишком медлительны или неспособны.

На самом деле, Ханфан Чжан, ведущий автор статьи о самосовершенствовании, заявил VentureBeat, что «во многих случаях опытный инженер с глубокими знаниями в предметной области может предложить более эффективные изменения, чем сегодня может предложить магистр права».

На самом деле, истинным узким местом ручной разработки является то, что она в значительной степени опирается на ситуативную отладку, а не на проверяемую, эмпирическую обратную связь. «Более глубокая проблема заключается в том, что в современной парадигме проектирования жгутов проводов часто отсутствует систематическая обратная связь», — объяснил Чжан. «Многие изменения вносятся на основе интуиции, нескольких наблюдаемых сбоев или ситуативной отладки».

В условиях быстрого выпуска новых моделей, полагаться на человеческую интуицию для ручной настройки специфических для каждой модели механизмов становится все более дорогостоящим и нецелесообразным. Хотя некоторые подходы используют более сильные модели для улучшения механизмов более слабых целевых агентов, эта зависимость от внешнего руководства имеет свои собственные проблемы, поскольку такие модели могут быть дорогостоящими, недоступными для перспективных моделей или не соответствовать режимам отказов целевой модели.

Как работает самозатягивающее крепление

Парадигма самонастройки позволяет агенту на основе LLM улучшать свою собственную систему наведения, не полагаясь на инженеров-людей или более сильные внешние модели.

Эта непрерывная самоэволюция обусловлена трехэтапным итеративным циклом, который преобразует данные о поведении в обновления системы:

Выявление слабых мест: Начиная с первоначальной конфигурации, агент выполняет набор задач, создавая трассировки выполнения с проверяемыми результатами. Агент классифицирует неудачные трассировки и пытается выявить специфические для модели закономерности сбоев.
Предложение по модификации системы: На основе этих моделей отказов агент, используя роль «предлагающего», генерирует набор разнообразных, но минимальных модификаций системы, каждая из которых привязана к конкретному механизму отказа, чтобы избежать слишком общих исправлений.
Проверка предложений: Система оценивает варианты модификаций с помощью регрессионных тестов. Модификация продвигается только в том случае, если она улучшает производительность без измеримого ухудшения в отложенных задачах. Если несколько вариантов модификаций проходят регрессионные тесты, они объединяются в следующую версию тестового набора, которая затем служит отправной точкой для следующей итерации.

Чтобы наглядно представить, зачем это может понадобиться предприятию, вообразите автоматизированного агента по устранению неполадок, который читает внутреннюю документацию, пишет патчи и открывает запросы на слияние. Если компания обновит свой стиль документации, агент может внезапно дать сбой, получив неверный контекст или написав некорректные патчи.

На первый взгляд, агент просто выглядит неисправным. Но Self-Harness превращает эту неоднозначную ошибку в решаемую проблему. «Трассировка ошибок показывает, где агент неправильно использует новый формат документации; инициатор может создать целевую правку для проверки… а оценщик может решить, улучшает ли эта правка неудачные случаи, не ухудшая другие», — сказал Чжан.

Самозатягивающееся крепление в действии

Исследователи оценили Self-Harness на Terminal-Bench-2.0, бенчмарке, тестирующем общее выполнение программ с использованием инструментов, включая управление артефактами, использование команд, поведение проверки и восстановление после ошибок выполнения. Они применили Self-Harness с MiniMax M2.5, Qwen3.5-35B-A3B и GLM-5.

Чтобы изолировать влияние саморазвивающегося тестового набора, они начали с минимального набора, построенного на основе DeepAgent SDK, содержащего только системную подсказку для бенчмарка, а также стандартные файловую систему и инструменты командной оболочки. Бэкенд модели, набор инструментов, среда бенчмарка и оценщик оставались неизменными, изменялся только сам тестовый набор.

Количественные результаты показывают, что агенты улучшили свою производительность благодаря автоматизированному редактированию моделей. В задачах, отложенных на потом, производительность значительно выросла по всем параметрам, увеличившись на 33–60 процентов в зависимости от модели.

Важно отметить, что явное правило принятия изменений способствует внедрению только тех правок, которые улучшают производительность без внесения неприемлемых регрессий. Мощь Self-Harness для корпоративных приложений заключается в том, что он не просто удлиняет запрос или добавляет общие инструкции. Вместо этого он вносит целенаправленные изменения, отражающие повторяющиеся проблемы, с которыми сталкивается каждая модель во время выполнения.

Например, в базовой конфигурации MiniMax M2.5 зависал в бесконечном процессе исследования конфигураций наборов данных до тех пор, пока не истекало время ожидания среды выполнения, что не приводило к созданию каких-либо результатов. Благодаря функции Self-Harness система выявила этот конкретный недостаток и добавила в свою политику выполнения «прерыватель цикла», заставляя агента останавливаться и перенаправлять свой подход после 50 вызовов инструмента. Она также добавила правило для создания начальной версии необходимых артефактов как можно раньше.

С другой стороны, Qwen-3.5 имел склонность к возникновению ошибки перезаписи файла, после чего система слепо повторяла одну и ту же команду, в конечном итоге удаляя необходимые файлы из-за путаницы, прежде чем остановиться. Самостоятельное управление исправило это, введя строгую дисциплину повторных попыток выполнения команд (запретив точные дубликаты команд) и механизм, который заставлял агент немедленно восстанавливать любые отсутствующие артефакты в случае ошибки файла.

GLM-5 испытывал трудности с сохранением изменений среды между различными командами и часто тратил время на масштабные загрузки или завершение задач, даже когда проверки корректности не проходили. Созданный им самим интерфейс вводил правила, предписывающие агенту сохранять переменные PATH между сеансами оболочки, ограничивать внешние вычисления и исправлять любые неудачные проверки корректности перед завершением работы.

Скрытые издержки автоматизированных жгутов проводов

Хотя технология Self-Harness автоматизирует утомительную работу по выявлению специфических сбоев модели, лица, принимающие решения, должны реалистично оценивать компромиссы. Замена человеческого фактора автоматизированным методом проб и ошибок требует значительных вычислительных затрат.

«Система Self-Harness заменяет часть работы, выполняемой инженерами-разработчиками, на повторную генерацию предложений, параллельную оценку кандидатов и регрессионное тестирование», — сказал Чжан. «Это может означать больше токенов API, большую задержку во время оптимизации и больше инфраструктуры для выполнения задач оценки».

Кроме того, эта система зависит от точности своего конвейера оценки. В ходе экспериментов на Terminal-Bench-2.0 исследователи полагались на строгие, детерминированные верификаторы, чтобы убедиться, что изменения, внесенные агентом, действительно полезны. Без этой строгой проверки автоматизированная система рискует способствовать появлению некорректных обновлений. «Система оценки — это не необязательный компонент; именно она позволяет нам обменять человеческую интуицию на эмпирические данные», — сказал Чжан.

Эта зависимость от строгих верификаторов также определяет, где следует развертывать Self-Harness. «Сегодня лучшие цели для развертывания — это среды, где сбои можно измерить и где метод проб и ошибок относительно безопасен», — сказал Чжан, указав на программирование, внутреннюю автоматизацию рабочих процессов и конвейеры данных DevOps как на идеальные варианты использования.

И наоборот, предприятиям следует избегать полной автоматизации процессов в областях с высокими ставками или субъективных областях. «Наиболее явные тревожные сигналы — это области, где оценка носит субъективный, отложенный, недетерминированный характер или ошибка в которых обходится дорого, например, принятие решений в медицине, инфраструктура, имеющая критически важное значение для безопасности, или юридические решения».

От тех, кто оперативно вносит корректировки, до архитекторов обратной связи.

Внедрение самосовершенствующихся агентов не означает, что программирование или корпоративные рабочие процессы внезапно станут полностью свободными от участия человека. Качество взаимодействия между инженером-человеком и ИИ по-прежнему имеет первостепенное значение и его сложно оценить с помощью автоматизированных тестов.

Вместо этого инженерная профессия поднимается на более высокий уровень абстракции. «Роль корпоративных инженеров сместится от ручного исправления отдельных подсказок или вызовов инструментов к проектированию систем обратной связи, которые позволят улучшить работу агентов», — предсказал Чжан. В дальнейшем «инженер станет не столько настройщиком подсказок, сколько архитектором обратной связи».

По мере того, как базовые модели становятся все более функциональными, они естественным образом будут усваивать многие возможности, которые в настоящее время требуют ручного проектирования программного обеспечения. «Но как только это произойдет, программное обеспечение не исчезнет; его возможности расширятся, чтобы связать модель с более сложной внешней средой», — сказал Чжан. «Пока эта граница не выйдет за пределы того, что могут оценить люди, люди останутся важнейшими источниками обратной связи».

Transform: Посмотрите, кто участвует в CTA

Подпишитесь, чтобы получать самые свежие новости!

Подробные аналитические данные для руководителей предприятий в области искусственного интеллекта, данных и безопасности.

VB Daily AI Weekly Еженедельник AGI Еженедельник по безопасности Еженедельник по инфраструктуре данных Мероприятия VB Все они

Отправляя свой адрес электронной почты, вы соглашаетесь с нашими Условиями использования и Политикой конфиденциальности.

Получайте обновления ! Вы подписаны! Наши последние новости скоро поступят на вашу электронную почту.

Источник: venturebeat.com

Оцените материал:

Оставить комментарий Отменить ответ

Для отправки комментария вам необходимо авторизоваться.

Сложности проектирования жгутов проводов

Как работает самозатягивающее крепление

Самозатягивающееся крепление в действии

Скрытые издержки автоматизированных жгутов проводов

От тех, кто оперативно вносит корректировки, до архитекторов обратной связи.

Подпишитесь, чтобы получать самые свежие новости!

Похожие записи

Похожие записи

Сторонники пессимистических прогнозов относительно искусственного интеллекта не сдаются.

Что будет дальше с вакцинами против птичьего гриппа?

Роскачество проверит мобильные игры «три в ряд» на манипулятивные механики и завышенную сложность.

Оставить комментарий Отменить ответ

Присоединяйтесь и подпишитесь на рассылку самых свежих новостей по Email