Вам не нужен ИИ-агент. Нужен workflow — и вот по каким признакам
Весной 2026 компания Sinch опросила больше 2500 руководителей, которые отвечают за внедрение ИИ. Результат неудобный для индустрии: 74% уже откатывали или выключали ИИ-агента, работавшего с клиентами, после запуска в прод. У компаний со зрелым управлением рисками — даже 81%. Причём дело почти никогда не в «глупой модели»: на первом месте утечки клиентских данных, дальше галлюцинации и репутация, а потом самое показательное — «не смогли понять, что вообще пошло не так».
Я делаю автоматизацию для малого бизнеса. И каждый второй запрос звучит как «нам нужен ИИ-агент». Почти всегда после разбора задачи оказывается, что агент там не нужен: нужен предсказуемый конвейер из нескольких вызовов модели, который можно прочитать, проверить и починить. И дело не в простоте — так надёжнее.
Ниже — где проходит граница между workflow и агентом, по каким критериям выбирать, сколько реально стоит автономность и почему мои собственные контентные конвейеры устроены как workflow, а не как агенты.
Главное из статьи
- Workflow и агент — разные инструменты. Workflow идёт по заранее заданным шагам в коде, агент сам решает, какие шаги делать. Большинству бизнес-задач нужен workflow.
- Автономность — самый дорогой и самый непредсказуемый режим из всего спектра. Платите вы не за модель, а за надёжность, аудит и оркестрацию вокруг неё.
- «Агент в проде» в 2026 — чаще всего workflow. То, что рынок зовёт агентами (сверка счетов, маршрутизация тикетов, извлечение данных), архитектурно — детерминированные конвейеры с моделью в нескольких узлах. Маршрут держит код, модель работает лишь в отдельных точках.
- Главный вопрос выбора один: можно ли описать шаги заранее? Можно — берите workflow. Нельзя предсказать набор подзадач — тогда и только тогда агент.
- Дефолт для малого бизнеса — workflow. Агент подключается точечно, под задачу, которую нельзя свести к фиксированному маршруту.
Откуда взялась путаница
В декабре 2024 Anthropic выпустила инженерный разбор «Building Effective Agents» — и он до сих пор остаётся самым трезвым текстом на тему. Там проводят важную границу внутри того, что все валят в кучу под словом «агент»:
- Workflow — система, где модель и инструменты управляются через заранее прописанные пути в коде. Разработчик решил: сначала шаг A, потом B, на развилке — проверка и маршрут C или D.
- Агент — система, где модель сама направляет свой процесс: решает, какие инструменты вызвать, в каком порядке, когда остановиться.
Разница не в мощности, а в том, кто держит контроль над маршрутом — код или модель.
И сразу третья путаница. Чат-бот стоит на другой оси: это интерфейс, окно, в котором пользователь пишет текстом. Под одним и тем же чат-окном работает что угодно. FAQ-бот, который отвечает по базе знаний, делает один вызов модели. Бот на классическом RAG, где найденные куски подставляются в промпт автоматически, кодом, остаётся workflow: модель не решает, искать ли, retrieval идёт всегда по фиксированному пути. И только когда модель сама решает, когда и что искать, мы сдвигаемся к агенту. Чат-бот бывает любым из трёх, поэтому он про то, как с системой общаются, а устройство внутри — это уже workflow или агент.
Маркетинг последних двух лет стёр эту границу. «Агент» стало модным словом, которое продаёт: автономность звучит как будущее, workflow — как «ну, скрипт». Вендоры моделей подталкивают в ту же сторону по понятной причине: агент в цикле жжёт на порядок больше токенов, чем конвейер из трёх вызовов. На Hacker News ту же мысль формулируют прямо: «большинство ИИ-агентов в проде на самом деле не такие уж агентные — лучшие из них это хорошо спроектированный софт с моделью, вкрученной в ключевых точках».
Что на самом деле работает в проде в 2026
Картина рынка за полтора года перевернулась. По данным обзоров 2026 года, около 54% компаний держат в проде то, что называют «ИИ-агентами». Но если посмотреть на архитектуру, это редко автономные агенты в строгом смысле: чаще — узко заскоупленные детерминированные исполнители (сверка счетов, проверка комплаенса, сортировка тикетов, извлечение данных). Маршрут у них держит код, а модель вызывается в нескольких заранее заданных точках. Маршрутизация, ретраи, фолбэки — это та же детерминированная обвязка, тоже код; модель внутри неё просто отрабатывает свой узел и возвращает результат. «Агентного» — в смысле «модель сама ведёт цикл» — там почти нет. По нашему определению это workflow, которому маркетинг приклеил ярлык «агент».
Несколько цифр, которые стоит держать в голове, когда вам в следующий раз продают «автономного агента»:
- Самые надёжные из этих систем делают меньше 5 вызовов модели за прогон — и это уже по сути workflow: вызовы идут из кода в заданных точках, а не модель сама крутит цикл. Чем длиннее настоящий автономный цикл, тем больше точек отказа.
- Среднее время до реальной отдачи от агента — около 4 месяцев, а не «две недели», как обещают на лендингах. Работа не в модели, а в обвязке: контракты API, пайплайны данных, авторизация, аудит-логи, откаты, эскалация на человека.
- MIT в 2026 насчитал, что 95% корпоративных пилотов с генеративным ИИ не дали измеримой бизнес-ценности — не подняли выручку и не снизили издержки.
Вывод простой: пользу приносит та часть, которую заковали в предсказуемый процесс. Ценность создаёт надёжная оркестрация вокруг модели — ровно её вы и оплачиваете.
Спектр сложности: где остановиться
Полезно перестать делить мир на «workflow или агент» и увидеть лестницу. Сложность растёт слева направо, и вместе с ней растут цена, непредсказуемость и боль при отладке.
Спектр сложности от одного промпта до MAS - Один вызов модели — плюс хороший контекст и пара примеров в промпте. Anthropic прямо пишет: для многих задач этого уже достаточно. Самый недооценённый уровень.
- Цепочка промптов — задача рубится на последовательные шаги, выход одного идёт на вход следующего. Между шагами можно поставить программные проверки-ворота: не прошёл проверку — не идём дальше.
- Роутер — модель классифицирует вход и направляет его на специализированный путь. «Это вопрос про доставку → ветка A, про возврат → ветка B». Каждая ветка заточена под свой тип запроса.
- Параллелизация — несколько вызовов работают одновременно, результаты собираются кодом. Либо разные аспекты одной задачи, либо несколько прогонов для надёжности с последующим голосованием.
- Оркестратор и воркеры — центральная модель динамически разбивает задачу на подзадачи и раздаёт их. Здесь уже появляется гибкость: набор подзадач заранее неизвестен. Но контур по-прежнему живёт в вашем коде.
- Автономный агент — модель сама ведёт цикл: планирует, действует, смотрит на результат, корректируется и сама решает, когда закончить. Сверху можно надстроить мультиагентную систему, где таких агентов несколько.
Ключевое наблюдение: каждая ступень вниз по списку — это рост стоимости и потеря контроля. Граница между workflow и агентом проходит между ступенями 5 и 6: на 1–5 маршрут держит ваш код (даже когда оркестратор сам раздаёт подзадачи), на 6 — модель. Большинство задач малого бизнеса закрываются на ступенях 1–3. Ступени 5–6 нужны там, где вы физически не можете прописать маршрут заранее — например, в кодинге, где число и характер изменений в файлах зависят от конкретной задачи.
Критерии выбора: пять честных вопросов
Когда ко мне приходят с «нужен агент», мы вместе прогоняем задачу по пяти осям. Удобно держать их рядом в виде матрицы.
Матрица выбора workflow vs agent по 5 критериям- Предсказуемость. Workflow на одинаковый вход даёт одинаковый маршрут. Агент на тот же вход в разных запусках может пойти по-разному — такова природа модели. Если бизнесу важна повторяемость, автономность работает против вас.
- Аудит и трассируемость. В workflow видно каждый шаг: вот лог, вот где остановились. У агента маршрут — чёрный ящик: «он решил сделать так». В регулируемых нишах (финансы, медицина, юр) это часто стоп-фактор.
- Цена и расход токенов. Конвейер из 3–5 вызовов считается заранее. Агент в цикле — нет: рекурсивные вызовы могут крутиться, пока кто-то не заметит счёт. Отдельный класс инцидентов: «петля бюджета», когда агент без жёсткого потолка жжёт деньги, как таксометр в пустой машине.
- Отладка. Сломался workflow — видно, на каком шаге. Сломался агент — «не знаем, почему он так сделал». Вспомните данные Sinch: третья по частоте причина откатов — невозможность диагностировать сбой.
- Можно ли описать шаги заранее? Это вопрос-водораздел. Если процесс фиксирован и вы можете его нарисовать, это workflow; совать туда автономную модель значит добавлять непредсказуемость на ровном месте. Если набор подзадач принципиально нельзя предсказать — вот здесь агент оправдан.
Простое правило: начинайте с самого простого уровня, который решает задачу, и поднимайтесь по лестнице только когда упёрлись в потолок. Не наоборот.
Сколько стоит автономность
Раздел, который любят пропускать в продающих презентациях. Автономность — не бесплатная суперсила, у неё есть прайс, и платится он не за модель.
Инженер Марк Лаурсен в 2026 опубликовал замер, который я считаю одним из самых полезных за год. Он взял один и тот же пайплайн из шести агентов, с одними и теми же моделями и промптами, и собрал его двумя способами: через популярный фреймворк-оркестратор и через явный код. Разница в надёжности — 41% успешных прогонов против 89%. Те же агенты, те же промпты, вся разница в оркестраторе. Его вывод: «агенты — это легко, координация — сложно; фреймворки делают агентов простыми и прячут координацию».
Туда же укладывается опыт компаний вроде Temporal, которые продают надёжное исполнение процессов. Их формулировка — «детерминированный хребет»: модель остаётся вероятностной системой, а вокруг неё ставится детерминированная оркестрация, которая ловит сбои, хранит состояние и умеет продолжить с места падения. Многие, по их словам, сейчас строят «версию 2.0 того же агента»: побежали быстро, пропустили обвязку, теперь переделывают на надёжном фундаменте.
И отрезвляющий момент с Hacker News, который точно описывает реальность: «все хотят агента, пока он не ошибётся один раз, отработав 99 раз подряд. Почему ошибся? Не знаем. Ну, навесим ещё пару ограничений… и вот мы снова вернулись к workflow». Сообщество, конечно, склонно сгущать — это голос практиков с уклоном в негатив, и удачные автономные кейсы существуют. Но претензия повторяется у слишком многих и слишком независимо, чтобы списать её на нытьё.
Сюда стоит относиться как к сигналу, а не как к приговору: автономные агенты работают — там, где гибкость важнее предсказуемости, и где вокруг них выстроены потолки расходов, откаты и человек в контуре на необратимых действиях. Просто это дорогой инструмент, а не дефолт.
Сам делаю так же: мои конвейеры — это workflow
Мне проще объяснять на своём. У меня есть два рабочих контентных конвейера — для статей в Дзен и для ежедневного AI-дайджеста. Со стороны это выглядит как «ИИ сам пишет и публикует». Внутри — нарочито скучный детерминированный конвейер, а не автономный агент.
Схема контентного конвейера (детерминированный, не агент)Устроено так: дешёвая модель (Qwen) ведёт оркестрацию по фиксированным шагам — собрать сырьё, переписать, прогнать через критику, очеловечить. И только финальную стилизацию делает более сильная модель (Claude Sonnet), которую я дёргаю одним вызовом через пайп: на вход текст, на выход текст. Никакого автономного цикла, где модель сама решает, что делать дальше.
Почему именно так:
- Предсказуемость. Каждый прогон проходит одни и те же шаги. Я знаю, что получу на выходе.
- Цена. Тяжёлую модель я зову один раз и только там, где она реально нужна — на финальной шлифовке. Остальное тянет дешёвая. Расход считается заранее.
- Отладка. Сломался дайджест — я открываю лог и вижу, на каком шаге. Не «агент почему-то решил».
Это ровно тот паттерн, который Anthropic, Temporal и Лаурсен описывают как надёжный. Я не строю автономного агента, потому что для этой задачи он добавил бы непредсказуемости и расходов, не добавив ценности. Если кто-то продаёт вам «полностью автономную контент-фабрику» — спросите, как она дебажится и сколько стоит один сбойный прогон.
Выводы
- Сначала спросите «можно ли описать шаги заранее». Если да — это workflow, и автономный агент здесь лишняя сложность, а не апгрейд.
- Считайте не модель, а обвязку. Реальная стоимость и реальный риск живут в оркестрации, аудите и откатах — там же, где компании и спотыкаются.
- Автономность — точечный инструмент, не дефолт. Берите её под задачи, где маршрут нельзя предсказать, и только с потолками расходов и человеком на необратимых шагах.
- «Скучный» конвейер из 3–5 вызовов — это не отставание, а зрелость. Рынок 2026 пришёл ровно к этому, просто продавать продолжают автономность.
FAQ
Чем агент отличается от workflow на практике?
Тем, кто решает маршрут. В workflow последовательность шагов прописана в коде — модель выполняет отдельные шаги. В агенте модель сама решает, какие шаги делать и когда остановиться. Внешне результат может быть похож, но предсказуемость, цена и отлаживаемость отличаются кардинально.
Мне нужен агент для чат-бота поддержки?
Почти наверняка нет — и здесь как раз путают интерфейс с архитектурой. Чат-бот это лишь окно диалога; за ним достаточно workflow: роутер определяет тип запроса, подтягивает данные из CRM или базы, отвечает или эскалирует на оператора. Это предсказуемо, дёшево и дебажится. Автономный агент под капотом добавит риск галлюцинаций без выигрыша.
Почему не взять готовый агентный фреймворк?
Для прототипа в блокноте — берите, он соберёт систему за вечер. Для прода с реальной ценой ошибки фреймворк часто прячет именно те режимы отказа, которые вам важнее всего видеть. Замеры показывают кратную разницу в надёжности между фреймворк-оркестрацией и явным кодом на одной и той же задаче.
Сколько стоит непредсказуемость агента на проде?
Дороже, чем кажется. Помимо лишних токенов в циклах — это инциденты, которые нельзя быстро диагностировать, и откаты после запуска. У трёх четвертей компаний дело дошло до отключения уже работавшего агента. Закладывайте в смету не вызовы модели, а время на обвязку: логи, потолки, эскалацию.
Workflow — это вчерашний день?
Наоборот. То, что в 2026 реально крутится в проде, — это узкие детерминированные процессы с моделью в ключевых точках. «Агентность» — модный ярлык, а не показатель зрелости решения.
Где я мог ошибиться
Я сознательно занял сторону: для большинства задач малого бизнеса дефолт — workflow. Но граница подвижная, модели умнеют, и набор задач, где автономность реально окупается, будет расти.
Поэтому встречный вопрос к тем, кто уже катал агентов в прод: где у вас автономность реально выиграла у детерминированного конвейера — и какой ценой по надёжности это далось? Если у вас обратный опыт, мне правда интересно его услышать.
Разбираю такие архитектуры на конкретных задачах в своём Telegram — там схемы и рабочие заметки из практики: @dmitra_ai.
Источник: vc.ru
Похожие записи
- Белый дом просит компанию OpenAI отложить выпуск новой модели из-за опасений по поводу безопасности.
- От экспериментов к инфраструктуре: почему корпоративный ИИ требует платформы, а не набора инструментов
- Компания Patronus AI привлекла 50 миллионов долларов на создание «цифровых миров», которые будут использоваться для стресс-тестирования агентов искусственного интеллекта.
Оцените материал:
Похожие записи
Таинственные внутренние процессы Ио, вулканического спутника Юпитера
16.06.2025
Что происходит в Вегасе: стероиды, пловцы и афера на миллиард долларов.
31.05.2026
Искусственный интеллект, использующий агентные технологии, решил проблему программирования — и выявил все остальные проблемы в разработке программного обеспечения.
07.06.2026Присоединяйтесь и подпишитесь на рассылку самых свежих новостей по Email
Получайте свежие новости и идеи на почту. Без спама — только самое интересное.
Нажимая «Подписаться», вы соглашаетесь с политикой конфиденциальности.
