Image

Разработка инструментов для агентов ИИ станет ключевым фактором внедрения ИИ в производство

Тарин Пламб

проектирование жгутов проводов

По мере того как модели становятся умнее и функциональнее, «инструменты», окружающие их, также должны развиваться. Эта «разработка инструментов» является продолжением разработки контекста, говорит соучредитель и генеральный директор LangChain Харрисон Чейз в новом эпизоде подкаста VentureBeat Beyond the Pilot. В то время как традиционные инструменты для ИИ, как правило, ограничивали работу моделей в циклах и вызове инструментов, инструменты, специально разработанные для агентов ИИ, позволяют им взаимодействовать более независимо и эффективно выполнять длительные задачи.

Чейз также высказался по поводу приобретения OpenClaw компанией OpenAI, утверждая, что вирусный успех компании объясняется готовностью «дать волю фантазии» так, как не стала бы ни одна крупная лаборатория, и задаваясь вопросом, действительно ли это приобретение приближает OpenAI к безопасной корпоративной версии продукта. «Тенденция в разработке вспомогательных средств заключается в том, чтобы фактически дать самой большой языковой модели (LLM) больше контроля над контекстной инженерией, позволяя ей решать, что она видит, а что нет», — говорит Чейз. «Теперь идея долго работающего, более автономного помощника вполне жизнеспособна».

Отслеживание прогресса и поддержание согласованности

Хотя концепция, позволяющая LLM работать в цикле и вызывать инструменты, кажется относительно простой, её сложно надёжно реализовать, отметил Чейз. Какое-то время модели были «ниже порога полезности» и просто не могли работать в цикле, поэтому разработчики использовали графы и писали цепочки, чтобы обойти это ограничение. Чейз привёл в пример AutoGPT — когда-то самый быстрорастущий проект на GitHub — как показательный пример: та же архитектура, что и у современных лучших агентов, но модели ещё не были достаточно хороши, чтобы надёжно работать в цикле, поэтому проект быстро сошёл на нет. Но по мере совершенствования LLM команды могут создавать среды, где модели могут работать в цикле и планировать на более длительные горизонты, и они могут постоянно улучшать эти среды. Ранее, по словам Чейза, «вы не могли вносить улучшения в среду, потому что вы не могли фактически запустить модель в ней». Решением LangChain стали Deep Agents, настраиваемая универсальная среда. Созданная на основе LangChain и LangGraph, она обладает возможностями планирования, виртуальной файловой системой, управлением контекстом и токенами, выполнением кода, а также функциями навыков и памяти. Кроме того, она может делегировать задачи субагентам; эти субагенты специализируются на различных инструментах и конфигурациях и могут работать параллельно. Контекст также изолирован, что означает, что работа субагента не засоряет контекст основного агента, а большой контекст подзадачи сжимается в один результат для повышения эффективности использования токенов. Все эти агенты имеют доступ к файловым системам, объяснил Чейз, и могут, по сути, создавать списки дел, которые они могут выполнять и отслеживать во времени. «Когда процесс переходит к следующему шагу, ко второму, третьему или четвертому шагу из 200-шагового процесса, у него есть способ отслеживать свой прогресс и сохранять эту согласованность», — сказал Чейз. «По сути, все сводится к тому, чтобы позволить LLM записывать свои мысли по мере выполнения». Он подчеркнул, что системы должны быть спроектированы таким образом, чтобы модели могли сохранять согласованность при выполнении длительных задач и были «податливыми» к тому, чтобы модели сами решали, когда сжимать контекст в точках, которые они считают «выгодными». Кроме того, предоставление агентам доступа к интерпретаторам кода и инструментам BASH повышает гибкость. А предоставление агентам навыков, а не просто инструментов, загруженных заранее, позволяет им загружать информацию, когда она им необходима. «Таким образом, вместо того, чтобы жестко закодировать все в одну большую системную подсказку, — объяснил Чейз, — можно использовать меньшую системную подсказку: „Это основная основа, но если мне нужно сделать X, позвольте мне прочитать навык для X. Если мне нужно сделать Y, позвольте мне прочитать навык для Y“». По сути, проектирование контекста — это «очень сложный» способ сказать: что видит LLM? Потому что это отличается от того, что видят разработчики, отметил он. Когда разработчики-люди могут анализировать трассировки агентов, они могут представить себя на месте ИИ и ответить на такие вопросы, как: Что представляет собой системная подсказка? Как она создается? Она статична или заполняется? Какие инструменты есть у агента? Когда он вызывает инструмент и получает ответ, как он представляется? «Когда агенты ошибаются, они ошибаются, потому что у них нет правильного контекста; когда они добиваются успеха, они добиваются успеха, потому что у них есть правильный контекст», — сказал Чейз. «Я думаю о контекстной инженерии как о предоставлении нужной информации в нужном формате магистру права в нужное время». Послушайте подкаст, чтобы узнать больше о:

  • Как LangChain построила свою архитектуру: LangGraph в качестве основного элемента, LangChain в центре, Deep Agents сверху.

  • Почему песочницы для кода станут следующим прорывом.

  • Как будет развиваться другой тип пользовательского опыта по мере того, как агенты будут работать с более длительными интервалами (или непрерывно).

  • Почему отслеживание и наблюдаемость являются ключевыми факторами для создания действительно работающего агента.

Вы также можете слушать и подписываться на Beyond the Pilot на Spotify , Apple или на любой другой платформе, где вы слушаете подкасты.

Подпишитесь, чтобы получать самые свежие новости!

Подробные аналитические данные для руководителей предприятий в области искусственного интеллекта, данных и безопасности.

VB Daily AI Weekly Еженедельник AGI Еженедельник по безопасности Еженедельник по инфраструктуре данных Мероприятия VB Все они

Отправляя свой адрес электронной почты, вы соглашаетесь с нашими Условиями использования и Политикой конфиденциальности.

Получайте обновления ! Вы подписаны! Наши последние новости скоро поступят на вашу электронную почту.

Источник: venturebeat.com

✅ Найденные теги: Агенты, ИИ, Инструменты, новости, производство, Разработка

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Изолированные среды восстановления становятся важнейшим элементом киберустойчивости.
Запустите модель искусственного интеллекта для преобразования речи в речь в реальном времени локально.
Робот и человек проверяют код на компьютерах, тестирование программного обеспечения.
Древняя резная табличка с изображением человека и символами на черном фоне.
Рука в воде с густыми зелеными водорослями, детализированная текстура.
Компания ReVision Implant планирует провести клинические испытания на первой фазе разработки интерфейса мозг-компьютер после того, как FDA присвоило ей статус «прорывного продукта» — Medical Device Network.
ideipro logotyp
CMS использует анализ данных и сотрудничество для борьбы с мошенничеством в программе Medicare | MobiHealthNews
Изображение человеческого мозга с нейроинтерфейсом на тёмном фоне.
Image Not Found
Изолированные среды восстановления становятся важнейшим элементом киберустойчивости.

Изолированные среды восстановления становятся важнейшим элементом киберустойчивости.

На выставке HIMSS26 в среду руководители компаний Sentara и AWS продемонстрировали, что изолированные от основной инфраструктуры IRE-сети, где критически важные системы и данные могут быть восстановлены в случае компрометации основной инфраструктуры, обеспечивают доступ к электронным медицинским картам…

Мар 12, 2026
Запустите модель искусственного интеллекта для преобразования речи в речь в реальном времени локально.

Запустите модель искусственного интеллекта для преобразования речи в речь в реальном времени локально.

В этом руководстве вы шаг за шагом узнаете, как установить и запустить PersonaPlex локально, чтобы вы могли в режиме реального времени использовать прерываемый ИИ для преобразования речи в речь прямо на своем компьютере. Изображение предоставлено автором. #…

Мар 12, 2026
Робот и человек проверяют код на компьютерах, тестирование программного обеспечения.

Как создать готовый к использованию код с помощью Claude Code

Узнайте, как писать надежный код с помощью агентов программирования. Делиться В этой статье я расскажу, как с помощью программистов можно писать код, готовый к использованию в продакшене. Агенты для разработки кода могут быстро генерировать большие объемы кода.…

Мар 12, 2026
Древняя резная табличка с изображением человека и символами на черном фоне.

Символы каменного века могут отодвинуть на второй план самые ранние формы письменности.

Загадочные знаки, выгравированные на предметах, свидетельствуют о том, что форма протописьменности могла использоваться в Европе 40 000 лет назад, за десятки тысяч лет до появления полноценной письменной системы. Фигурка «Адорант», возраст которой составляет приблизительно 38 000 лет,…

Мар 12, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых