Разработанная в Стэнфорде система DeLM сокращает затраты на выполнение задач с участием нескольких агентов на 50% — без центрального координатора.
Тарин Пламб
Одно из предположений, лежащих в основе современных фреймворков ИИ, заключается в том, что агентам необходим «босс» в центре; этот координатор управляет процессом, направляет запросы и следит за тем, чтобы вся система не погрузилась в хаос.
Это предположение может быть неверным, и его последствия можно измерить в долларах, затраченных на вывод информации, и задержке координации. Новая структура Стэнфордского университета, называемая децентрализованной языковой моделью (DeLM), основана на предпосылке, что агенты могут координировать свои действия напрямую, не направляя каждое обновление через центральный контроллер.
Общая база знаний DeLM служит «общей коммуникационной основой», позволяя агентам развивать проверенный прогресс друг друга, не направляя каждое взаимодействие через основного агента для «объединения, фильтрации и повторной трансляции», — объясняют Ючжэнь Мао и Азалия Мирхосейни, соавторы фреймворка, в своей исследовательской работе.
Это система, которая не только возможна, но и желательна в определенных случаях. «Агенты могут опираться на предыдущие результаты, избегать повторных неудач, сохранять ограничения и получать подробные доказательства только тогда, когда это необходимо».
Проблемы традиционных многоагентных систем
В типичной централизованной многоагентной системе главный агент разбивает задачи на подзадачи, распределяет их между несколькими субагентами параллельно, ожидает ответов, объединяет и суммирует промежуточный прогресс, а затем запускает следующую волну приказов на основе собранной информации.
Хотя это естественный способ масштабирования рассуждений LLM, исследователи из Стэнфорда утверждают, что он плохо масштабируется. Каждое полезное открытие, частичное открытие и неудача должны быть переданы обратно главному агенту, который затем определяет, какую информацию следует объединить и повторно передать нижестоящим агентам.
«По мере роста числа подзадач этот контроллер становится узким местом в коммуникации и интеграции», — пишут Мао и Мирхосейни. Кроме того, главный оркестратор может «разбавлять, упускать или искажать» полезную информацию, что приводит к потере прогресса.
Это узкое место также возникает в сценариях рассуждений в длинном контексте. Получив отчеты от субагентов, главный агент, как правило, группирует связанные понятия, точки данных и другие материалы вместе в цикле обучения без учителя. Затем он может предварительно распределить эти «кластеры доказательств» между субагентами, прежде чем узнать, какой из обнаруженных материалов действительно актуален или правильно ли он объединен.
Когда вспомогательный агент получает такой недостаточный контекст, он, по сути, приходит в замешательство и возвращается к основному агенту, запуская новый раунд извлечения или делегирования. «Этот обмен данными замедляет координацию, делает ее более итеративной и все более ограниченной одним перегруженным основным агентом», — пишут исследователи.
VB Transform · 14–15 июля · Менло-Парк · Агентная оркестровка
Компания Intuit перестроила свою многоагентную систему за 60 дней. Что именно они изменили и почему?
На конференции Transform руководители инженерных подразделений из Intuit, Target и Instacart рассказывают о том, как они перепроектировали свои архитектуры оркестрации для повышения надежности, масштабируемости и удовлетворения потребностей реальных клиентов.
Ознакомиться с полной программой →
Что решает DeLM и как это работает.
В отличие от этого, DeLM построена на основе параллельных агентов, общего контекста и очереди задач.
Общий контекст представляет собой, по сути, тщательно подобранный набор «кратких изложений» или сводок информации, которые могут оказаться полезными для других агентов. Сюда входят проверенные и основанные на доказательствах результаты, а также частичные результаты и задокументированные неудачи; они также указывают на подробные доказательства, которые агенты могут использовать в зависимости от своей конкретной задачи.
Очередь задач представляет собой набор последовательных ожидающих выполнения подзадач, которые агенты могут брать на себя независимо друг от друга.
«Агенты записывают компактные, проверенные обновления в общий контекст, который последующие агенты могут читать напрямую», — пишут исследователи. Полезные результаты, ошибки и ограничения накапливаются как «общее состояние проблемы», а не проходят через центральный контроллер.
Конвейер выглядит следующим образом:
-
Инициализация: Входные данные разбиваются на различные рабочие единицы и добавляются в очередь;
-
Параллельное выполнение: Агенты работают независимо и в тандеме, получая задачи и анализируя общий контекст по мере их выполнения.
-
Сжатие и проверка: Результаты сжимаются в многократно используемые «краткие изложения», которые проверяются на соответствие подтверждающим данным. С группой делятся только полностью проверенными изложениями.
-
Дополнительная работа (при необходимости): Когда очередь обнуляется, последний агент, вернувший ответ, проверяет весь общий контекст, чтобы определить, требуется ли дальнейшая работа.
-
Заключительный этап: последний агент определяет, что дальнейшие шаги не требуются, и возвращает окончательный ответ.
Исследователи поясняют, что агенты «обмениваются информацией о ходе выполнения задач посредством общего состояния, асинхронно заявляют о готовности задач и более адаптивно масштабируются по мере роста числа подзадач».
Как DeLM проявляет себя в реальных условиях
С помощью DeLM агенты могут избегать избыточного исследования; повторно использовать и развивать открытия и ошибки друг друга; и сосредоточиться на нерешенных проблемах.
Данная структура может быть особенно полезна в масштабировании времени тестирования программного обеспечения, когда моделям дается время «подумать», чтобы улучшить их способности к рассуждению и решению проблем. Различные агенты могут исследовать свои собственные гипотезы или следовать путям рассуждения параллельно, при этом разделяя промежуточный прогресс. Одним из примеров является одновременная отладка.
DeLM также подходит для рассуждений в длительном контексте и ответов на вопросы, содержащие множество документов; агенты могут одновременно изучать свои собственные кластеры доказательств (коллекции документов, кода или других материалов), сохраняя при этом «глобальное компактное представление» накопленных доказательств.
Исследователи утверждают, что это делает задачи, решаемые агентами, более точными и значительно дешевле. Это подтверждается результатами его работы на реальных тестах: на SWE-bench Verified — инструменте, оценивающем, насколько хорошо модели и агенты ИИ решают реальные задачи разработки программного обеспечения — он показал результат на 10,5% лучше, чем самый сильный базовый вариант, и снизил стоимость задачи примерно на 50%.
Но это может выходить за рамки программирования: в тесте LongBench‑v2 Multi‑Doc QA, который оценивает способность моделей LLM обрабатывать задачи с длинным контекстом, характерные для реального мира, модель DeLM показала наивысшую точность среди четырех семейств моделей, включая GPT‑5.4, Claude Sonnet, Gemini Flash и DeepSeek‑V4‑Pro.
DeLM превосходит другие модели в SWE-Bench по ряду причин, как подробно рассказал Мао на X.
Во-первых, агенты делятся своими неудачами. В обычных параллельных запусках, когда один агент идет по неверному пути, эта неудача остается конфиденциальной, и последующие агенты могут тратить время (и деньги), преследуя тот же тупик. Но с DeLM неудачные гипотезы записываются в общий контекст.
«В дальнейшем агенты могут воспринимать их как ограничения, избегать повторного исследования и перенаправлять свой поиск на более перспективные решения», — сказал Мао.
Кроме того, ограничения, после проверки, немедленно добавляются в общий контекст агентов. Это означает, что они становятся обязательным общим состоянием. «Позже агенты наследуют их, строят на их основе и избегают повторения глобально некорректных упрощений», — сказал Мао.
Что особенно важно, DeLM обеспечивает компактность совместного прогресса для повторного использования. Он является разворачиваемым, то есть агенты по умолчанию видят краткие обзоры, но могут по желанию развернуть их в более подробные резюме и исходные данные.
Как отмечают исследователи, предоставление всех исходных документов и трассировок дает агентам максимальное количество информации, но это может перегрузить их контекстные окна и в конечном итоге увеличить затраты.
«Если бы агенты обменивались полными трассировками, каждому работнику пришлось бы читать длинные истории команд, дампы файлов, неудачные попытки редактирования и промежуточные рассуждения, превращая саму координацию в еще одно узкое место, требующее обработки большого контекста», — сказал Мао.
С другой стороны, хотя обмен краткими резюме обходится дешевле, важные детали и доказательства могут быть потеряны, что приводит к менее надежным выводам.
Таким образом, развертывание обеспечивает доступ к информации по принципу «от грубой до точной настройки». Это может повысить точность и снизить затраты.
В конечном итоге, с помощью такой структуры, как DeLM, агенты могут быть более эффективными, поскольку им не приходится многократно читать одни и те же документы или повторно запускать один и тот же неудачный анализ; более результативными, поскольку полезные результаты распространяются по параллельным потокам; и более надежными, поскольку они обмениваются только проверенными утверждениями.
Для разработчиков корпоративных решений DeLM ставит под сомнение ключевое предположение: что каждому многоагентному рабочему процессу необходим центральный контроллер. Результаты SWE-bench и LongBench-v2 показывают, что децентрализованная модель не только теоретически чище, но и быстрее, точнее и примерно вдвое дешевле.

Подпишитесь, чтобы получать самые свежие новости!
Подробные аналитические данные для руководителей предприятий в области искусственного интеллекта, данных и безопасности.
VB Daily AI Weekly Еженедельник AGI Еженедельник по безопасности Еженедельник по инфраструктуре данных Мероприятия VB Все они
Отправляя свой адрес электронной почты, вы соглашаетесь с нашими Условиями использования и Политикой конфиденциальности.
Получайте обновления ! Вы подписаны! Наши последние новости скоро поступят на вашу электронную почту.
Источник: venturebeat.com
Оцените материал:
Похожие записи
Обзор на позитивизм (философское направление, утверждающее, что единственный источник познания это навучные данные)
08.02.2026
Полногеномное секвенирование изменит течение беременности
16.09.2025
Посвящение Дзиро Ямаде, художнику-автомобилисту (1960-2025) [видео]
07.06.2026Присоединяйтесь и подпишитесь на рассылку самых свежих новостей по Email
Получайте свежие новости и идеи на почту. Без спама — только самое интересное.
Нажимая «Подписаться», вы соглашаетесь с политикой конфиденциальности.
