Ознакомьтесь с текущим состоянием разработки ИИ-агентств доступным способом: разъяснение терминологии и поиск подтверждающих доказательств.

Изображение предоставлено редактором.
# Введение
LangChain , одна из ведущих на сегодняшний день платформ для создания и управления приложениями искусственного интеллекта (ИИ) на основе больших языковых моделей (LLM) и разработки агентов, недавно опубликовала отчет «Состояние разработки агентов» , в котором были опрошены 1300 специалистов различных профессий и сфер деятельности, чтобы выявить текущее состояние этой заметной тенденции в области ИИ.
В этой статье представлены некоторые наиболее важные выводы и идеи из отчета, которые изложены в доступной для широкой аудитории форме, а также раскрываются ключевые термины и профессиональная терминология, связанные с агентами искусственного интеллекта. Более подробную информацию о ключевых концепциях, лежащих в основе агентов ИИ, вы также можете найти в этой статье.
Прежде чем перейти к фактам, цифрам и подтверждающим доказательствам для каждого из трех наших главных выводов, мы приводим краткое объяснение некоторых ключевых терминов и определений:
# Крупные предприятия опережают стартапы по темпам производства
Ключевые понятия, которые необходимо знать:
- Агент : система искусственного интеллекта, которая, в отличие от стандартных чат-приложений, реагирующих на действия пользователя, способна самостоятельно принимать решения и совершать действия. В наиболее распространенном сегодня контексте агенты используют LLM в качестве своего «мозга», управляя принятием решений о дальнейших шагах — например, запросе к базе данных, отправке электронного письма или выполнении веб-поиска — для достижения цели.
- Производственная среда : Хотя это базовое понятие в разработке программного обеспечения, оно может показаться незнакомым читателям с другим образованием. «В производственной среде» означает, что программная система запущена, и реальные пользователи, клиенты или сотрудники используют её для выполнения какой-либо работы или действия. По сути, это то, что следует за прототипом или подтверждением концепции (PoC): тестовая версия программного обеспечения, которая была запущена в контролируемой среде для выявления и устранения возможных проблем.
Основные факты, содержащиеся в отчете:
- Хотя существует распространенное заблуждение о том, что крупные компании медленнее внедряют новые технологии из-за бюрократических проволочек, данные свидетельствуют об обратном: они лидируют в развертывании ИИ-агентов: 67% организаций с численностью сотрудников более 10 000 человек внедрили приложения на основе агентов в производство, и только 50% небольших организаций с численностью сотрудников менее 100 человек сделали это.
- К причинам, указанным выше, могут относиться, например, стоимость создания надежных агентских решений, требующая значительных инвестиций в инфраструктуру.
Аналогичные данные можно найти в отчетах Deloitte «Состояние ИИ в корпоративном секторе в 2026 году» и McKinsey «Состояние ИИ в 2025 году» .
# Разрыв между наблюдаемостью и оценкой
Ключевые понятия, которые необходимо знать:
- Наблюдаемость : модели ИИ, особенно продвинутые, часто воспринимаются как непрозрачные «черные ящики» с непредсказуемыми результатами. Наблюдаемость — это возможность проверять и фиксировать, что «думает» ИИ и как это приводит к принятию решений или результатам.
- Трассировка : специфический аспект наблюдаемости, заключающийся в пошаговой записи пути, пройденного агентом ИИ, то есть, пути его рассуждений.
- Автономная оценка : Она заключается в обработке тестового набора данных с известными «правильными» ответами для измерения точности и эффективности работы агента ИИ (или другой системы ИИ).
Основные факты, содержащиеся в отчете:
- Поразительные 89% респондентов из всех областей внедрили механизм мониторинга, хотя только 52,4% проводят офлайн-оценки, что выявляет заметное несоответствие между тем, как команды отслеживают работу агентов ИИ, и тем, насколько тщательно они проверяют их производительность.
- Это свидетельствует о подходе «следуй и следи», при котором инженерные команды отдают приоритет отладке ошибок после их возникновения, а не предотвращению их до внедрения в производство. Ремонт «сломанных роботов» вместо обеспечения их надлежащей работы перед отправкой с «завода» может повлечь за собой нежелательные последствия и затраты.
Аналогичные доказательства можно найти в статье Гискарда о наблюдаемости и оценке в рамках программы LLM .
# Стоимость больше не является главным препятствием: качество — это главное.
Ключевые понятия, которые необходимо знать:
- Галлюцинации : Когда модель ИИ, такая как LLM, уверенно генерирует ложную или бессмысленную информацию, выдавая её за истину, говорят, что она галлюцинирует. Это опасная проблема, когда в процесс вмешиваются агенты ИИ, поскольку проблема заключается не только в том, чтобы сказать что-то неправильное, но и в потенциальном совершении чего-то неправильного — например, бронировании авиабилета на основе неточных или неверно полученных данных.
- Задержка : Это скорость или задержка между вопросом пользователя и ответом, предоставленным агентом, с учетом логического процесса или «размышления» между ними, часто с использованием инструментов. Это увеличивает время, затрачиваемое по сравнению с автономными LLM-системами или чат-ботами.
Основные факты, содержащиеся в отчете:
- По мнению респондентов, стоимость внедрения агентов ИИ больше не является критически важной проблемой: 32% из них называют качество главным препятствием для внедрения и использования таких агентов.
- В данном контексте качество подразумевает точность, последовательность и отсутствие галлюцинаций.
- Между тем, есть один интересный нюанс: второй по важности барьер различается в зависимости от размера компании: небольшие стартапы указывают на задержки, а предприятия с численностью персонала более 2000 человек — на безопасность и соответствие нормативным требованиям.
Аналогичные подтверждающие доказательства можно найти в ранее упомянутом отчете Deloitte «Препятствия на пути внедрения ИИ» , а более подробный анализ основных препятствий для предприятий представлен в этой статье на Medium .
Иван Паломарес Карраскоса — лидер, писатель, спикер и консультант в области искусственного интеллекта, машинного обучения, глубокого обучения и магистратуры. Он обучает и направляет других в применении ИИ в реальном мире.
Источник: www.kdnuggets.com























