Image

Обзор отчета о состоянии разработки агентских систем: ключевые выводы и термины

Ознакомьтесь с текущим состоянием разработки ИИ-агентств доступным способом: разъяснение терминологии и поиск подтверждающих доказательств.

Обзор отчета о состоянии разработки агентских систем
Изображение предоставлено редактором.

# Введение

LangChain , одна из ведущих на сегодняшний день платформ для создания и управления приложениями искусственного интеллекта (ИИ) на основе больших языковых моделей (LLM) и разработки агентов, недавно опубликовала отчет «Состояние разработки агентов» , в котором были опрошены 1300 специалистов различных профессий и сфер деятельности, чтобы выявить текущее состояние этой заметной тенденции в области ИИ.

В этой статье представлены некоторые наиболее важные выводы и идеи из отчета, которые изложены в доступной для широкой аудитории форме, а также раскрываются ключевые термины и профессиональная терминология, связанные с агентами искусственного интеллекта. Более подробную информацию о ключевых концепциях, лежащих в основе агентов ИИ, вы также можете найти в этой статье.

Прежде чем перейти к фактам, цифрам и подтверждающим доказательствам для каждого из трех наших главных выводов, мы приводим краткое объяснение некоторых ключевых терминов и определений:

# Крупные предприятия опережают стартапы по темпам производства

Ключевые понятия, которые необходимо знать:

  • Агент : система искусственного интеллекта, которая, в отличие от стандартных чат-приложений, реагирующих на действия пользователя, способна самостоятельно принимать решения и совершать действия. В наиболее распространенном сегодня контексте агенты используют LLM в качестве своего «мозга», управляя принятием решений о дальнейших шагах — например, запросе к базе данных, отправке электронного письма или выполнении веб-поиска — для достижения цели.
  • Производственная среда : Хотя это базовое понятие в разработке программного обеспечения, оно может показаться незнакомым читателям с другим образованием. «В производственной среде» означает, что программная система запущена, и реальные пользователи, клиенты или сотрудники используют её для выполнения какой-либо работы или действия. По сути, это то, что следует за прототипом или подтверждением концепции (PoC): тестовая версия программного обеспечения, которая была запущена в контролируемой среде для выявления и устранения возможных проблем.

Основные факты, содержащиеся в отчете:

  • Хотя существует распространенное заблуждение о том, что крупные компании медленнее внедряют новые технологии из-за бюрократических проволочек, данные свидетельствуют об обратном: они лидируют в развертывании ИИ-агентов: 67% организаций с численностью сотрудников более 10 000 человек внедрили приложения на основе агентов в производство, и только 50% небольших организаций с численностью сотрудников менее 100 человек сделали это.
  • К причинам, указанным выше, могут относиться, например, стоимость создания надежных агентских решений, требующая значительных инвестиций в инфраструктуру.

Аналогичные данные можно найти в отчетах Deloitte «Состояние ИИ в корпоративном секторе в 2026 году» и McKinsey «Состояние ИИ в 2025 году» .

# Разрыв между наблюдаемостью и оценкой

Ключевые понятия, которые необходимо знать:

  • Наблюдаемость : модели ИИ, особенно продвинутые, часто воспринимаются как непрозрачные «черные ящики» с непредсказуемыми результатами. Наблюдаемость — это возможность проверять и фиксировать, что «думает» ИИ и как это приводит к принятию решений или результатам.
  • Трассировка : специфический аспект наблюдаемости, заключающийся в пошаговой записи пути, пройденного агентом ИИ, то есть, пути его рассуждений.
  • Автономная оценка : Она заключается в обработке тестового набора данных с известными «правильными» ответами для измерения точности и эффективности работы агента ИИ (или другой системы ИИ).

Основные факты, содержащиеся в отчете:

  • Поразительные 89% респондентов из всех областей внедрили механизм мониторинга, хотя только 52,4% проводят офлайн-оценки, что выявляет заметное несоответствие между тем, как команды отслеживают работу агентов ИИ, и тем, насколько тщательно они проверяют их производительность.
  • Это свидетельствует о подходе «следуй и следи», при котором инженерные команды отдают приоритет отладке ошибок после их возникновения, а не предотвращению их до внедрения в производство. Ремонт «сломанных роботов» вместо обеспечения их надлежащей работы перед отправкой с «завода» может повлечь за собой нежелательные последствия и затраты.

Аналогичные доказательства можно найти в статье Гискарда о наблюдаемости и оценке в рамках программы LLM .

# Стоимость больше не является главным препятствием: качество — это главное.

Ключевые понятия, которые необходимо знать:

  • Галлюцинации : Когда модель ИИ, такая как LLM, уверенно генерирует ложную или бессмысленную информацию, выдавая её за истину, говорят, что она галлюцинирует. Это опасная проблема, когда в процесс вмешиваются агенты ИИ, поскольку проблема заключается не только в том, чтобы сказать что-то неправильное, но и в потенциальном совершении чего-то неправильного — например, бронировании авиабилета на основе неточных или неверно полученных данных.
  • Задержка : Это скорость или задержка между вопросом пользователя и ответом, предоставленным агентом, с учетом логического процесса или «размышления» между ними, часто с использованием инструментов. Это увеличивает время, затрачиваемое по сравнению с автономными LLM-системами или чат-ботами.

Основные факты, содержащиеся в отчете:

  • По мнению респондентов, стоимость внедрения агентов ИИ больше не является критически важной проблемой: 32% из них называют качество главным препятствием для внедрения и использования таких агентов.
  • В данном контексте качество подразумевает точность, последовательность и отсутствие галлюцинаций.
  • Между тем, есть один интересный нюанс: второй по важности барьер различается в зависимости от размера компании: небольшие стартапы указывают на задержки, а предприятия с численностью персонала более 2000 человек — на безопасность и соответствие нормативным требованиям.

Аналогичные подтверждающие доказательства можно найти в ранее упомянутом отчете Deloitte «Препятствия на пути внедрения ИИ» , а более подробный анализ основных препятствий для предприятий представлен в этой статье на Medium .

Иван Паломарес Карраскоса — лидер, писатель, спикер и консультант в области искусственного интеллекта, машинного обучения, глубокого обучения и магистратуры. Он обучает и направляет других в применении ИИ в реальном мире.

Источник: www.kdnuggets.com

✅ Найденные теги: Агентские Системы, Выводы, новости, Обзор, отчет, Разработка, Состояние

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Крупный план кожи с желтыми чешуйками, возможно, дерматологическая проблема.
ideipro logotyp
Разработан новый инструментарий для внедрения цифрового здравоохранения, ориентированного на ценность, в Индонезии.
Трехмерный график плотности с цветовым градиентом на оранжево-фиолетовом фоне.
Корабль в открытом море в пасмурный день. Вид с высоты.
Абстрактные световые линии в форме графиков на черном фоне.
Кибератака на Stryker: компания продолжает борьбу с последствиями инцидента связанной с Ираном хакерской группы Handala
ideipro logotyp
Джереми Реннер рассказывает о почти смертельной аварии и призывает к улучшению обмена данными в сфере здравоохранения | MobiHealthNews
Image Not Found
Крупный план кожи с желтыми чешуйками, возможно, дерматологическая проблема.

Древние угли рассказали о времени появления лесов на территории современной Калининградской области после отхода ледника

Обугленные растительные остатки под микроскопом © Людмила Лазукова / РГПУ имени А.И. Герцена. Ученые выяснили, что хвойные и лиственные деревья распространились по территории современной Калининградской области не позднее 14 тысяч лет назад. К такому выводу авторы пришли…

Мар 17, 2026
ideipro logotyp

Следуйте за деньгами: международная экспансия клеточной терапии, вакцина против коклюша BPZE1, разработка антител de novo с использованием искусственного интеллекта следующего поколения

Автор: сотрудники Bio-IT World 25 февраля 2026 г. | Компания Cellares расширяет свою деятельность в разных странах для коммерческого запуска и производства клеточной терапии; ILiAD Biotechnologies продвигает свой кандидат на вакцину против коклюша следующего поколения, BPZE1; Galux…

Мар 17, 2026
Разработан новый инструментарий для внедрения цифрового здравоохранения, ориентированного на ценность, в Индонезии.

Разработан новый инструментарий для внедрения цифрового здравоохранения, ориентированного на ценность, в Индонезии.

Разработанная совместно с исследователями из Университета Монаша концепция «Инновационной цифровой системы здравоохранения, основанной на ценностях» призвана помочь индонезийским больницам согласовать цифровые инновации с программой SATUSEHAT и достичь измеримых результатов. (Правительство и политика) Фото: monkeybusinessimages via Getty Images…

Мар 17, 2026
Трехмерный график плотности с цветовым градиентом на оранжево-фиолетовом фоне.

Интуитивное руководство по алгоритму Марковских цепей Маркова (Часть I): Алгоритм Метрополиса-Хастингса

Устали от шумихи вокруг ИИ? Давайте поговорим о вероятностных алгоритмах, которые на самом деле лежат в основе высокоэффективных количественных финансовых исследований. Делиться Как произвести выборку из сложной, ненормированной функции плотности, которая выглядит как вулкан? Читайте дальше. Если…

Мар 17, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых