Image

Разработка инструментов для агентов ИИ станет ключевым фактором внедрения ИИ в производство

Тарин Пламб

проектирование жгутов проводов

По мере того как модели становятся умнее и функциональнее, «инструменты», окружающие их, также должны развиваться. Эта «разработка инструментов» является продолжением разработки контекста, говорит соучредитель и генеральный директор LangChain Харрисон Чейз в новом эпизоде подкаста VentureBeat Beyond the Pilot. В то время как традиционные инструменты для ИИ, как правило, ограничивали работу моделей в циклах и вызове инструментов, инструменты, специально разработанные для агентов ИИ, позволяют им взаимодействовать более независимо и эффективно выполнять длительные задачи.

Чейз также высказался по поводу приобретения OpenClaw компанией OpenAI, утверждая, что вирусный успех компании объясняется готовностью «дать волю фантазии» так, как не стала бы ни одна крупная лаборатория, и задаваясь вопросом, действительно ли это приобретение приближает OpenAI к безопасной корпоративной версии продукта. «Тенденция в разработке вспомогательных средств заключается в том, чтобы фактически дать самой большой языковой модели (LLM) больше контроля над контекстной инженерией, позволяя ей решать, что она видит, а что нет», — говорит Чейз. «Теперь идея долго работающего, более автономного помощника вполне жизнеспособна».

Отслеживание прогресса и поддержание согласованности

Хотя концепция, позволяющая LLM работать в цикле и вызывать инструменты, кажется относительно простой, её сложно надёжно реализовать, отметил Чейз. Какое-то время модели были «ниже порога полезности» и просто не могли работать в цикле, поэтому разработчики использовали графы и писали цепочки, чтобы обойти это ограничение. Чейз привёл в пример AutoGPT — когда-то самый быстрорастущий проект на GitHub — как показательный пример: та же архитектура, что и у современных лучших агентов, но модели ещё не были достаточно хороши, чтобы надёжно работать в цикле, поэтому проект быстро сошёл на нет. Но по мере совершенствования LLM команды могут создавать среды, где модели могут работать в цикле и планировать на более длительные горизонты, и они могут постоянно улучшать эти среды. Ранее, по словам Чейза, «вы не могли вносить улучшения в среду, потому что вы не могли фактически запустить модель в ней». Решением LangChain стали Deep Agents, настраиваемая универсальная среда. Созданная на основе LangChain и LangGraph, она обладает возможностями планирования, виртуальной файловой системой, управлением контекстом и токенами, выполнением кода, а также функциями навыков и памяти. Кроме того, она может делегировать задачи субагентам; эти субагенты специализируются на различных инструментах и конфигурациях и могут работать параллельно. Контекст также изолирован, что означает, что работа субагента не засоряет контекст основного агента, а большой контекст подзадачи сжимается в один результат для повышения эффективности использования токенов. Все эти агенты имеют доступ к файловым системам, объяснил Чейз, и могут, по сути, создавать списки дел, которые они могут выполнять и отслеживать во времени. «Когда процесс переходит к следующему шагу, ко второму, третьему или четвертому шагу из 200-шагового процесса, у него есть способ отслеживать свой прогресс и сохранять эту согласованность», — сказал Чейз. «По сути, все сводится к тому, чтобы позволить LLM записывать свои мысли по мере выполнения». Он подчеркнул, что системы должны быть спроектированы таким образом, чтобы модели могли сохранять согласованность при выполнении длительных задач и были «податливыми» к тому, чтобы модели сами решали, когда сжимать контекст в точках, которые они считают «выгодными». Кроме того, предоставление агентам доступа к интерпретаторам кода и инструментам BASH повышает гибкость. А предоставление агентам навыков, а не просто инструментов, загруженных заранее, позволяет им загружать информацию, когда она им необходима. «Таким образом, вместо того, чтобы жестко закодировать все в одну большую системную подсказку, — объяснил Чейз, — можно использовать меньшую системную подсказку: „Это основная основа, но если мне нужно сделать X, позвольте мне прочитать навык для X. Если мне нужно сделать Y, позвольте мне прочитать навык для Y“». По сути, проектирование контекста — это «очень сложный» способ сказать: что видит LLM? Потому что это отличается от того, что видят разработчики, отметил он. Когда разработчики-люди могут анализировать трассировки агентов, они могут представить себя на месте ИИ и ответить на такие вопросы, как: Что представляет собой системная подсказка? Как она создается? Она статична или заполняется? Какие инструменты есть у агента? Когда он вызывает инструмент и получает ответ, как он представляется? «Когда агенты ошибаются, они ошибаются, потому что у них нет правильного контекста; когда они добиваются успеха, они добиваются успеха, потому что у них есть правильный контекст», — сказал Чейз. «Я думаю о контекстной инженерии как о предоставлении нужной информации в нужном формате магистру права в нужное время». Послушайте подкаст, чтобы узнать больше о:

  • Как LangChain построила свою архитектуру: LangGraph в качестве основного элемента, LangChain в центре, Deep Agents сверху.

  • Почему песочницы для кода станут следующим прорывом.

  • Как будет развиваться другой тип пользовательского опыта по мере того, как агенты будут работать с более длительными интервалами (или непрерывно).

  • Почему отслеживание и наблюдаемость являются ключевыми факторами для создания действительно работающего агента.

Вы также можете слушать и подписываться на Beyond the Pilot на Spotify , Apple или на любой другой платформе, где вы слушаете подкасты.

Подпишитесь, чтобы получать самые свежие новости!

Подробные аналитические данные для руководителей предприятий в области искусственного интеллекта, данных и безопасности.

VB Daily AI Weekly Еженедельник AGI Еженедельник по безопасности Еженедельник по инфраструктуре данных Мероприятия VB Все они

Отправляя свой адрес электронной почты, вы соглашаетесь с нашими Условиями использования и Политикой конфиденциальности.

Получайте обновления ! Вы подписаны! Наши последние новости скоро поступят на вашу электронную почту.

Источник: venturebeat.com

✅ Найденные теги: Агенты, ИИ, Инструменты, новости, производство, Разработка

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

ideipro logotyp
CMS использует анализ данных и сотрудничество для борьбы с мошенничеством в программе Medicare | MobiHealthNews
Изображение человеческого мозга с нейроинтерфейсом на тёмном фоне.
График планов и мероприятий по эпиднадзору за инфекционными заболеваниями в Африке 2014-2015.
Деревянная скульптура человека в задумчивой позе на синем фоне.
Коричневый свитер с воротником и этикеткой "Quince", сделан из викуньи в Перу.
ideipro logotyp
Люди в лодке на реке в ночи, силуэты на фоне деревьев и гор.
ideipro logotyp
Image Not Found
ideipro logotyp

Новая компания MiniMed получила одобрение ЕС на использование инсулиновой помпы MiniMed 780G и системы непрерывного мониторинга уровня глюкозы Instinct от Abbott

Вскоре после выхода на биржу бывшее подразделение Medtronic по производству препаратов для лечения диабета, MiniMed, заявило о получении европейского разрешения на подключение своей основной инсулиновой помпы к эксклюзивному устройству непрерывного мониторинга уровня глюкозы производства Abbott. В сентябре…

Мар 12, 2026
CMS использует анализ данных и сотрудничество для борьбы с мошенничеством в программе Medicare | MobiHealthNews

CMS использует анализ данных и сотрудничество для борьбы с мошенничеством в программе Medicare | MobiHealthNews

На конференции HIMSS26 руководители Центра оперативной защиты от мошенничества (FDOC) агентства обсудили, как эта инициатива помогает выявлять мошенничество в режиме реального времени. (Государственная политика) Участники дискуссии HIMSS26 «Быстрое реагирование: внедрение Центра оперативной защиты от мошенничества» Фото предоставлено…

Мар 12, 2026
Изображение человеческого мозга с нейроинтерфейсом на тёмном фоне.

STAT+: Что стоит между мозговыми имплантатами и одобрением FDA?

Вы читаете веб-версию информационного бюллетеня STAT о технологиях в здравоохранении. Управление оповещениями для этой статьи Отправить эту статью по электронной почте Поделитесь этой статьей Adobe Вы читаете веб-версию информационного бюллетеня STAT о технологиях в здравоохранении — нашего…

Мар 12, 2026
График планов и мероприятий по эпиднадзору за инфекционными заболеваниями в Африке 2014-2015.

Уроки, извлеченные из реакции Руанды на вспышку вируса Марбург

Доступ через ваше учебное заведение. Купить или оформить подписку. В сентябре 2024 года Руанда объявила о вспышке болезни, вызванной вирусом Марбург (БМВ), что стало критическим моментом для системы здравоохранения страны. Спустя год после начала мер реагирования мы…

Мар 12, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых