Н. Шашидар, EdgeVerve

Представлено компанией Edgeverve
Создание интеллектуальных, полуавтономных агентов искусственного интеллекта, обрабатывающих сложные бизнес-задачи в режиме реального времени, — это привлекательная перспектива. Но переход от впечатляющих пилотных проектов к внедрению в производство требует большего, чем просто остроумные подсказки или демонстрации концепции. Необходимы четкие цели, рабочие процессы, основанные на данных, и корпоративная платформа, которая с самого начала обеспечивает баланс между автономностью, управлением, наблюдаемостью и гибкостью, а также жесткие ограничения.
От пилотов до «оперативных серых зон»
Следующая волна ценности сосредоточена в связующих звеньях между приложениями — в тех операционных «серых зонах», где передача данных, сверка, утверждения и поиск информации по-прежнему зависят от людей. Назначение агентов на эти пути означает разрушение системных границ, применение интеллекта к контексту и переосмысление процессов, которые никогда не были формально автоматизированы. Многие пилотные проекты заходят в тупик, потому что они начинаются как лабораторные эксперименты, а не как ориентированные на результат проекты, привязанные к производственным системам, средствам управления и KPI.
Начинайте с результатов, а не с алгоритмов. Преобразуйте ключевые показатели эффективности организации (денежный поток, DSO, соблюдение SLA, показатели соответствия требованиям, MTTR, NPS, утечка заявок и т. д.) в цели для агентов, а затем распределите их на задачи для отдельных агентов и групп агентов. Только после того, как цели будут четко определены, следует выбирать рабочие процессы и декомпозировать задачи.
Выберите цели, затем разбейте работу на этапы.
Что на самом деле означает «цель»? В агентных программах цель — это результат деятельности и сценарий использования, который его определяет. Например, целевой результат — «сократить неиспользованные денежные средства на 20%»; сценарий использования — «обработка денежных поступлений и исключений». Имея сценарий использования, выполните декомпозицию задач на уровне персон: определите роль человека (например, аналитик по обработке денежных поступлений, координатор объектов), перечислите их задачи и выявите, какие из них готовы к агентизации (извлечение данных, сопоставление, проверка политик, предложения решений, инициирование транзакций).
Для выполнения этих задач необходима интегрированная в данные система управления рабочими процессами, способная считывать, записывать и обрабатывать информацию в корпоративных системах, соблюдая при этом права доступа. Данные должны быть готовы к использованию в системах искусственного интеллекта, легкодоступны, управляемы, помечены там, где это необходимо, дополнены для удобства поиска (RAG) и защищены политиками в отношении персональных данных, PCI и нормативных требований.
Интеграция выходит за рамки API.
API — это один из способов интеграции, но не единственный. Надежное выполнение агентов обычно сочетает в себе:
Стабильные API
с управлением жизненным циклом основных систем
Триггеры, управляемые событиями
(потоковые передачи, веб-хуки, CDC) для реагирования в режиме реального времени
Резервные варианты UI/RPA
где API отсутствуют
Соединители Search/RAG
для документов и баз знаний
Управление политикой
с помощью различных инструментов и действий для обеспечения соблюдения прав и разделения обязанностей.
Главная задача — обеспечение надежности интеграции, основанное на идемпотентности, повторных попытках, механизмах защиты от сбоев и стандартизированных схемах инструментов, чтобы агенты не «выдумывали» действия, которые предприятие не может проверить.
Быстрый пример: финансы и производственные мощности на производстве.
Внутри нашей организации мы задействовали специализированных агентов в реальной рабочей среде финансового директора и в отделе технического обслуживания зданий. В финансовом отделе семь агентов взаимодействовали с производственными системами и реальными структурами подотчетности. Результаты первого года включали: улучшение ежемесячного денежного потока более чем на 3%, повышение производительности в затронутых рабочих процессах на 50%, ускорение процесса адаптации новых сотрудников на 90%, переход от обработки на уровне отдельных счетов к координации на уровне функций и увеличение денежного потока на 32 млн долларов. Эти результаты не гарантируют повсеместного улучшения; они показывают, что разработка продуктов может обеспечить измеримые результаты в масштабах.
Четыре основных принципа проектирования: автономия, управление, наблюдаемость и оценка, гибкость.
1) Автономия: соизмерьте её с риском.
Автономия существует в широком диапазоне. На ранних этапах часто автоматизируются четко определенные задачи; другие стремятся к созданию агентов для исследований/анализа; все чаще команды ориентируются на критически важные транзакционные агенты (платежи, подключение поставщиков, изменение цен). Правило: соотнесите автономность с риском и закодируйте режим работы для каждой задачи как «только предложение», «предложение и утверждение» или «выполнение с откатом».
2) Управление: защитные механизмы изначально заложены, а не являются дополнительными элементами.
Неограниченное количество агентов создает неприемлемый риск. Включите в план ограничительные меры:
Политика и разрешения : привязка инструментов/действий к идентификаторам, областям действия и правилам разделения обязанностей.
Человек в процессе разработки (Human-in-the-loop, HITL): ситуация, когда преодолеваются критически важные пороговые значения (объем, риск со стороны поставщика, регуляторная нагрузка).
Управление жизненным циклом агентов : версионирование, контроль изменений, этапы регрессионного тестирования, рабочие процессы утверждения и прекращение поддержки.
Оркестрация сторонних агентов : проверка внешних агентов, таких как поставщики, их возможности, области действия, журналы, соглашения об уровне обслуживания (SLA).
Инцидент и откат : аварийные выключатели, безопасный режим и компенсирующие транзакции. Вот как это работает.
Безопасное масштабирование инноваций при одновременной защите бренда, соблюдении нормативных требований и защите интересов клиентов.
3) Наблюдаемость и оценка: доверие формируется на основе телеметрии.
К агентам, работающим в производственной среде, предъявляются те же требования, что и к любой основной платформе:
Телеметрия: сбор полной информации о ходе выполнения операций, включая восприятие, планирование, использование инструментов и действия, с последующим структурированием журналов и воспроизведением.
Офлайн-оценка : тестирование сценариев, проверка на наличие ошибок, проверка на предвзятость и безопасность, сравнительный анализ затрат и производительности; сравнение базового варианта с вариантом-претендентом.
Онлайн-оценка : теневой режим, A/B-тестирование, канареечные тесты, оповещения о нарушении правил безопасности, обратная связь от пользователей.
Объяснимость и возможность аудита : почему было предпринято то или иное действие, какие данные/инструменты были использованы и кто дал одобрение.
4) Гибкость: учитывать волатильность, проектировать с учетом возможности обмена.
Модели, инструменты и поставщики быстро меняются. Рассматривайте возможности агентов как валюту платформы: создайте среду, в которой команды смогут оценивать, выбирать и заменять модели/инструменты, не разрушая существующую систему. Используйте маршрутизатор моделей, реестр инструментов и интерфейсы, ориентированные на контракты, чтобы обновления представляли собой контролируемые эксперименты, а не переписывание кода.
Структура агентской платформы: как платформизация превращает цели в результаты.
Для создания по-настоящему агентного предприятия необходима платформа, которая преобразует цели в результаты, а не набор разрозненных пилотных проектов. Эта платформа обеспечивает каскады KPI от предприятия к агентам, способствует декомпозиции задач и планированию работы нескольких агентов, а также предоставляет управляемые инструменты и доступ к данным через API, RPA, поиск и базы данных.
Она централизует знания и память с помощью хранилищ RAG и векторов, обеспечивает корпоративный контроль через механизм политик и управляет производительностью и безопасностью через единый уровень модели. Она поддерживает надежную оркестровку агентов первого и третьего лица с общим контекстом, внедряет глубокие конвейеры мониторинга и оценки, а также применяет дисциплинированный подход к разработке релизов от песочницы до общедоступной версии. Наконец, она обеспечивает долгосрочную отказоустойчивость за счет управления жизненным циклом, версионирования, устаревания, сценариев реагирования на инциденты и проверяемой истории.
Ограждения в действии: пример из финансового сектора.
Рассмотрим обработку исключений при платежах в банковской сфере — это ответственный, регулируемый и на виду у клиента процесс. Оператор предлагает решение (например, автоматическое согласование или эскалация) только в следующих случаях:
Данная сделка не превышает пороговых значений риска; превышение этих значений влечет за собой одобрение HITL.
Все проверки на соответствие корпоративной политике (KYC/AML, скорость обработки запросов, санкции) пройдены успешно.
Механизмы мониторинга фиксируют обоснование, используемые инструменты и данные.
Откат/компенсация предусмотрены в случае возникновения сбоев в последующих процессах. Эта схема применима к процессу подключения поставщиков, изменению цен или рассмотрению претензий — критически важной работе с четко определенными механизмами безопасности.
Масштабирование за пределы пилотных проектов.
Масштабирование агентного ИИ за пределы пилотных проектов требует дисциплинированной готовности по девяти направлениям: руководители должны четко определить, какие KPI важны и как цели агентов соотносятся с ними, определить, какие задачи для отдельных пользователей будут выполняться агентами, а какие останутся управляемыми человеком, и согласовать каждый из них с правильным режимом автономности — от простого предложения до предложения и утверждения, а также выполнения с возможностью отката. Они должны внедрить механизмы управления, включая точки HITL и контроль жизненного цикла; обеспечить надежную наблюдаемость и оценку с помощью телеметрии, воспроизведения, аудита и офлайн/онлайн-тестов; и проверить готовность данных с помощью управляемых, защищенных политиками потоков данных с расширенными возможностями извлечения. Интеграция должна быть надежной, с управлением жизненным циклом API, триггерами событий и резервными вариантами RPA/других. Базовая платформа должна обеспечивать возможность замены моделей и оркестрацию агентов первого и третьего лица без перестройки. Наконец, при оценке необходимо сосредоточиться на реальном влиянии на операционную деятельность: денежных потоках, времени выполнения, качестве и снижении рисков, а не на количестве выполненных задач.
Главный вывод
Агентный ИИ — это не короткий путь; это новая система работы. Предприятия, которые подходят к этому с дисциплиной платформы, согласовывая автономность с рисками, внедряя управление и наблюдаемость, а также проектируя с учетом возможности замены, превратят пилотные проекты в результаты, влияющие на производство. Те, кто этого не делает, продолжают накапливать впечатляющие, но разрозненные демонстрации. Разница не в скорости внедрения агента, а в том, насколько целенаправленно вы проектируете предприятие вокруг него.
Н. Шашидар — старший вице-президент и глобальный руководитель отдела управления продуктами в компании EdgeVerve.
Спонсорские статьи — это контент, созданный компанией, которая либо оплачивает публикацию, либо имеет деловые отношения с VentureBeat, и они всегда четко обозначены. Для получения дополнительной информации обращайтесь по адресу sales@venturebeat.com .
Подпишитесь, чтобы получать самые свежие новости!
Подробные аналитические данные для руководителей предприятий в области искусственного интеллекта, данных и безопасности.
Отправляя свой адрес электронной почты, вы соглашаетесь с нашими Условиями использования и Политикой конфиденциальности.
Получайте обновления ! Вы подписаны! Наши последние новости скоро поступят на вашу электронную почту.
Источник: venturebeat.com





















