Закажи экспресс-аудит своего дела онлайн всего за 199 ₽
и получи рекомендации по улучшению - Жми сюда !

Компания Resolve AI утверждает, что бум программирования с использованием ИИ разрушает производственные системы. Она хочет это исправить.

Майкл Нуньес

Nuneybits Векторное изображение одного неоново-желто-зеленого глаза, открытого с помощью ИИ e84a55ca-5cf2-49ff-9486-757f960ca6dc

Источник: VentureBeat, создано с помощью Midjourney

Компания Resolve AI, стартап в сфере управления производственными процессами, поддерживаемый Greylock и Lightspeed Venture Partners, сегодня объявила о масштабном расширении своей платформы, включающем постоянно работающих фоновых агентов, переработанную архитектуру расследований и общее рабочее пространство, где инженеры и агенты ИИ сотрудничают в режиме реального времени при расследовании инцидентов.

Главным элементом релиза является новая многоагентная система расследования, разработанная собственной исследовательской лабораторией Resolve AI. Вместо того чтобы задействовать одного ИИ-агента для диагностики производственного сбоя — аналогично инженеру, работающему в режиме дежурства, — платформа теперь отправляет скоординированную команду специализированных агентов, которые параллельно проверяют несколько гипотез, независимо подтверждают выводы друг друга и выстраивают полные причинно-следственные связи от первопричины до симптома. Компания заявляет, что новая архитектура обеспечивает более чем двукратное повышение точности определения первопричины по результатам внутренних оценочных тестов по сравнению с предыдущими версиями платформы.

«Представьте себе одного оператора, работающего по вызову, как человек», — сказал генеральный директор и соучредитель Resolve AI Спирос Ксантос в эксклюзивном интервью VentureBeat перед анонсом. «Теперь у нас есть команда операторов, которые работают вместе, почти как команда людей, устраняющих проблему, и это вдвое повысило качество».

Это объявление появилось в момент острой напряженности в индустрии программного обеспечения. Генерация кода с помощью ИИ получила стремительное распространение, позволив командам разработчиков выпускать значительно больше программного обеспечения, чем два года назад. Однако поддержание работоспособности этого программного обеспечения в производственной среде — отладка при возникновении ошибок, мониторинг после развертывания, проверка его состояния — по-прежнему в подавляющем большинстве случаев осуществляется вручную. Для компании, которая в начале этого года привлекла 125 миллионов долларов в рамках раунда финансирования серии А при оценке в 1 миллиард долларов, Resolve AI делает прямую ставку на то, что операционная сторона жизненного цикла программного обеспечения станет следующим крупным рубежом для инвестиций в ИИ.

Что показывают сотни реальных тестовых случаев относительно заявленной точности?

Любое заявление стартапа о точности заслуживает тщательной проверки, и компания Xanthos откровенно рассказала как о масштабе, так и об ограничениях оценки. Показатель двукратного увеличения получен на основе внутренних сравнительных тестов, а не стороннего аудита, хотя набор данных для оценки был составлен таким образом, чтобы отражать сложность, с которой ежедневно сталкиваются корпоративные клиенты Resolve AI.

«Это очень сложные, комплексные оценки, которые мы создавали на протяжении длительного времени, чтобы представить реальные примеры», — объяснил Ксантос. «Это не данные клиентов, но эти оценки представляют собой сложные случаи, подобные тем, с которыми мы сталкивались в некоторых из крупнейших технологических компаний, с которыми мы работаем». Он описал набор как состоящий из сотен случаев, отражающих производственные сбои, с которыми сталкиваются такие компании, как Coinbase, Salesforce, DoorDash и Zscaler — все они являются клиентами Resolve AI.

Практическое значение этого повышения точности значительно. Агенты Resolve AI теперь выступают в роли первых реагирующих на каждое оповещение, как правило, проводя первичную оценку ситуации в течение пяти минут, прежде чем к делу подключится инженер-человек. В предыдущих публичных заявлениях компания указывала на то, что DoorDash сократила время выявления первопричины проблемы до 87 процентов. Когда Ксантоса попросили объяснить эту цифру, он описал типичный базовый уровень.

«Когда что-то идёт не так, человеку может потребоваться от пяти до десяти минут, чтобы даже достать свой ноутбук и подключиться», — сказал он. «Типичное среднее время восстановления составляет десятки минут, иногда часы, в зависимости от серьёзности проблемы. Поэтому улучшение более чем на 80 процентов — в четыре-пять раз быстрее — это действительно огромный успех. Этого мы никогда раньше не достигали с помощью ИИ, инструментов, данных или мониторинга».

Как агенты искусственного интеллекта проверяют факты друг друга, чтобы предотвратить ложные первопричины

Одна из основных проблем при применении больших языковых моделей в критически важных производственных средах заключается в их склонности генерировать правдоподобно звучащие, но неверные ответы — это сбой, который в контексте сбоя в работе системы может заставить команду инженеров искать неправильное решение, в то время как сервис останется недоступным.

Ксантос прямо это признал. «Это очень распространенная проблема с готовыми моделями, — сказал он. — Они всегда пытаются дать вам ответ, и если у них недостаточно доказательств, они дадут вам наилучший возможный ответ, который, скорее всего, окажется неверным».

В качестве контрмеры Resolve AI использует систему многоуровневой проверки между своими агентами. Каждый агент, исследующий гипотезу, должен привести все доказательства, на которые он опирается, и представить эти доказательства другому агенту для независимой проверки. Исследующий агент должен построить полную причинно-следственную цепочку — от первопричины до симптома — а другие агенты активно пытаются опровергнуть теорию, выявляя пробелы в логике.

«Часто агенты фактически опровергают эти теории, потому что находят пробелы», — сказал Ксантос. «Существует множество уровней защиты и проверок со стороны агентов, которые позволяют Resolve быть очень точным и не вводить в заблуждение».

Не менее важно, по его словам, чтобы система признавала свое незнание. «Планка для того, чтобы действительно сказать: „У меня есть ответ“, очень высока. В таких случаях она скажет: „Вот доказательства, которые я нашел. Вот три или четыре пути, по которым вы можете пойти дальше, но я не смог полностью доказать, что проблема именно в этом“. Такая система, работающая в производственной среде, не может быть „черным ящиком“». В областях, где неправильные ответы несут операционные последствия, откалиброванная неопределенность может быть более ценной, чем уверенные результаты. Для системы ИИ, интегрированной в рабочий процесс реагирования на инциденты, уверенное указание инженерам неверного направления во время сбоя, затрагивающего клиента, может усугубить тот самый вред, который она была призвана предотвратить.

Внутри новой команды агентов, которые никогда не отвлекаются от работы.

Помимо реагирования на инциденты, Resolve AI представляет новый класс фоновых агентов, предназначенных для выполнения непрерывной, часто незаметной оперативной работы, которую должны выполнять инженерные команды, но которую им сложно поддерживать в масштабах предприятия.

Эти агенты работают по расписанию или автоматически активируются в ответ на события — новое развертывание, срабатывание оповещения, объединенный запрос на слияние — и накапливают знания, полученные в ходе каждого расследования и взаимодействия с людьми. Когда инженер открывает интерфейс Resolve AI, агенты уже работают: проводят предварительное расследование приоритетных проблем, отслеживают развертывания, проверяют чистоту оповещений, выявляют отклонения в конфигурации и обнаруживают аномалии в стоимости.

Ксантос провел различие между фоновыми агентами и агентами реагирования на инциденты, которые были основным предложением Resolve AI. «Теперь вы можете запускать этих агентов в фоновом режиме постоянно — не только когда человек просит агента отладить проблему или когда срабатывает оповещение», — сказал он. «Многие наши клиенты сейчас отслеживают изменения, которые попадают в рабочую среду, прежде чем они вызовут проблему. Есть агент, который постоянно отслеживает эти изменения».

Он описал этих фоновых агентов как «универсальных агентов SRE, доступных каждому разработчику», способных выполнять задачи, начиная от мониторинга изменений инфраструктуры, которые могут увеличить затраты на облачные сервисы, и заканчивая выполнением работы по устранению последствий инцидентов, например, генерацией исправлений кода на основе полученных в результате инцидента знаний. Эта концепция решает структурную проблему в сфере эксплуатации программного обеспечения: ежедневные задачи, необходимые для поддержания работоспособности производственных систем — мониторинг развертываний, расследование оповещений, отслеживание изменений в сложных средах — критически важны, но выполняются реактивно и вручную. Инженерные организации понимают, что эта работа необходима, но она конкурирует за внимание с разработкой новых функций. Автоматизированные агенты, выполняющие эту работу непрерывно, могли бы перевести команды с реактивного решения проблем на проактивное оперативное управление.

Общее рабочее пространство, где инженеры и агенты искусственного интеллекта проводят совместные исследования.

Третий важный компонент релиза — это то, что компания называет общей поверхностью расследования — рабочее пространство, где инженеры и агенты ИИ работают с одними и теми же данными в режиме реального времени во время активного инцидента. Отчеты динамически обновляются по мере развития расследования. Каждое обнаруженное нарушение доступно для проверки. Инженеры могут изучать побочные расследования, не прерывая основной рабочий процесс. Запросы к исходным данным можно извлекать и изменять на месте, доказательства встраиваются непосредственно в рабочее пространство, а действия по устранению неполадок могут быть запущены из одного и того же интерфейса без переключения инструментов.

«Представьте это как интерфейс ко всем производственным инструментам, а также как интерфейс, где люди и агенты могут сотрудничать друг с другом — или агенты с агентами», — сказал Ксантос. «Именно это постепенно приводит к большему доверию и большей автоматизации, потому что вы работаете с агентом, обучаете его и видите результаты».

Компания также предоставляет свою платформу в виде REST API и сервера MCP (Model Context Protocol), что позволяет командам разработчиков интегрировать Resolve AI в более широкие рабочие процессы и инфраструктуру, основанные на работе агентов. По словам Ксантоса, это уже происходит на практике. «Универсальный агент, созданный компанией, — когда дело доходит до отладки, этот агент может вызвать Resolve», — сказал он. «Или кто-то работает над своим агентом для программирования на ноутбуке, и Resolve отображается там как MCP. Если есть какая-то деятельность, связанная с производством, агент для программирования может ее вызвать». Взаимодействие между системами свидетельствует о том, что Resolve AI рассматривает себя не как закрытую систему, а как специализированный узел в более широкой экосистеме агентов ИИ, которые будут все чаще передавать задачи друг другу — модель, которую Ксантос сравнил с открытой архитектурой веб-сайтов, а не с моделью «закрытого сада» магазина приложений.

Почему Resolve AI утверждает, что может превзойти Datadog, PagerDuty и гигантов облачных технологий?

За последний год рынок операционных решений для агентов значительно перенасытился. Datadog, PagerDuty и крупные облачные провайдеры анонсировали возможности использования искусственного интеллекта для оптимизации операционных процессов. На вопрос о том, что отличает Resolve AI от этих лидеров рынка, Ксантос указал на глубину технической базы компании.

«Мы работаем на передовой. Нет готового шаблона для создания системы, подобной Resolve», — сказал он. Он отметил, что вместе с соучредителем Маянком Агарвалом они создали OpenTelemetry, самый распространенный проект с открытым исходным кодом в области мониторинга, который теперь служит де-факто стандартом для сбора метрик, журналов и трассировок из современных программных систем.

Ксантос также отметил недавнее открытие компанией лаборатории искусственного интеллекта, возглавляемой исследователем, которого он описал как бывшего руководителя отдела постобучения моделей Llama в Meta. «Ему удалось объединить глубокие знания в области мониторинга производственных процессов с искусственным интеллектом и моделями, и я думаю, это очень уникально», — сказал Ксантос. «Я не думаю, что какая-либо другая компания, будь то компания с опытом в области мониторинга или стартап, обладает всем этим».

По словам представителей Xanthos, структурная защита компании включает в себя полную модель среды, которую Resolve создает для каждого клиента, систему памяти, обучающуюся в специфической производственной среде клиента, и многоагентную архитектуру. В настоящее время лаборатория проводит постобучение базовых моделей на данных, специфичных для производственной среды — своего рода процедурные знания, которые опытные инженеры используют для отладки производственных проблем, но которые не встречаются в стандартных наборах данных для обучения моделей. Такой подход отражает все более распространенную тенденцию среди компаний, занимающихся разработкой приложений ИИ: использование базовых моделей в качестве базового слоя, но значительные инвестиции в специализированную тонкую настройку, поиск и архитектуру агентов для достижения уровней точности, недостижимых для универсальных моделей.

Как ценообразование, основанное на результатах, меняет экономику применения ИИ в производстве.

Ценовая модель Resolve AI отличается от традиционной модели лицензирования корпоративного программного обеспечения. Компания продает кредиты, которые расходуются, когда агенты выполняют работу — подход, ориентированный на результат, который напрямую связывает стоимость с предоставляемой ценностью.

«Мы не продаем программное обеспечение, — сказал Ксантос. — Вы покупаете и используете Resolve, приобретая кредиты, которые расходуются, когда Resolve выполняет какое-либо действие. Это основано на результате. Кредиты расходуются только тогда, когда Resolve устраняет неполадку, связанную с предупреждением».

Он прямо ответил на вопрос о стоимости, утверждая, что Resolve AI на самом деле дешевле, чем альтернативный вариант — создание аналогичной системы с нуля с использованием моделей граничных возможностей и интеграции с MCP. «Если взять Opus или GPT-5.4 и попытаться создать решение, подобное Resolve, с использованием MCP, мы подсчитали — в итоге вы потратите гораздо больше токенов, чем платите Resolve, потому что наша система очень оптимизирована с точки зрения контекста, с точки зрения того, как она считывает данные временных рядов».

Что касается постоянно работающих фоновых агентов, Ксантос отметил, что их непрерывный характер не обязательно увеличивает затраты. «Фоновый агент не означает, что он постоянно выполняет интенсивную работу. Это означает, что он может быть доступен; вы можете поручить ему любую задачу. Многие из этих задач запускаются на основе какого-либо действия — срабатывает оповещение, кто-то объединяет запрос на слияние, и вы хотите проверить, влияет ли это на производство». Для корпоративных клиентов в регулируемых отраслях — таких как Coinbase и Zscaler — размещение и безопасность данных являются обязательными. Resolve AI учитывает это благодаря гибкой модели развертывания: плоскость данных располагается там, где уже находятся существующие инструменты клиента, а слой вывода может работать как стандартное SaaS-развертывание или внутри VPC, созданного специально для клиента. «Мы разработали Resolve для работы с крупными предприятиями, где стандарты безопасности самые высокие», — сказал Ксантос. «Мы принимаем множество мер для обеспечения безопасности Resolve, включая отказ от хранения данных».

Почему руководители инженерных подразделений постепенно учатся доверять агентам ИИ в работе с производственными системами

Вопрос о том, будут ли инженерные команды доверять агентам ИИ выполнение автономных действий в производственной среде — откат развертывания, добавление ресурсов, создание запроса на слияние — является одной из определяющих культурных проблем этой технологической волны. Ксантос провел аналогию с автономными транспортными средствами.

«Чтобы разрешить автомобилю самостоятельно передвигаться по улице, мы должны доказать, что это безопаснее, чем управление человеком. Использование агентов в производстве — это очень похожая концепция», — сказал он. Он признал, что не все клиенты чувствуют себя комфортно, когда агенты выполняют автоматизированные действия, но описал градацию доверия, которая, по его мнению, будет быстро развиваться.

«Существует набор действий, которые относительно безопасны и которые большинство технологических компаний, вероятно, считают приемлемыми для выполнения агентом, и, вероятно, есть и другой набор действий, которые должны быть одобрены человеком», — сказал он. «Но поскольку качество продолжает расти, как мы видим в Resolve, я бы сказал, что в этом году мы преодолеем порог, когда большинство действий будет выполняться агентом автоматически».

Он описал типичную схему внедрения: компании начинают с того, что агенты дают рекомендации, а затем человек решает, нажимать ли кнопку. В течение нескольких недель или месяцев доверие постепенно укрепляется. «Я не думаю, что проблема в том, что мы просто позволяем агентам действовать бездумно с самого начала», — сказал Ксантос. Постепенный подход отражает то, как всегда работало внедрение корпоративных технологий — от миграции в облако до оркестровки контейнеров, организации движутся со скоростью доверия, а не со скоростью развития возможностей.

Аргумент о том, что код, сгенерированный ИИ, усугубляет производственный кризис, а не улучшает его, звучит так:

Пожалуй, самый провокационный аргумент в тезисе Resolve AI заключается в том, что взрывной рост кода, генерируемого ИИ, на самом деле усугубляет проблему эксплуатации в производственной среде. В недавнем посте на LinkedIn компания Xanthos сформулировала эту динамику в резких терминах, утверждая, что руководители инженерных отделов, которые радуются более быстрой разработке кода, не инвестируя в эксплуатацию в производственной среде, фактически заставляют своих старших инженеров «субсидировать скорость» за счет увеличения нагрузки на реагирование на инциденты.

В своем интервью VentureBeat он вернулся к этой теме. «Теперь, когда программисты создают код, мы создаем гораздо больше кода, с которым мы — люди — менее знакомы, поэтому нам нужна защита со стороны ИИ», — сказал он.

Такая трактовка позиционирует Resolve AI не просто как инструмент повышения производительности, но и как необходимый противовес революции в программировании с использованием ИИ. По мере того, как организации внедряют все больше кода, написанного инструментами, которые их инженеры могут не до конца понимать, и запускают его в производственных системах, которые эти инженеры не создавали, утверждается, что операционная сложность — и последствия сбоев — будут расти пропорционально. В октябре прошлого года в подкасте Stack Overflow Ксантос привел цифры, подтверждающие это утверждение, подсчитав, что инженеры тратят более 70 процентов своего времени на обслуживание и устранение неполадок в производственных системах, а не на разработку новых функций. «Мы столкнулись с новым кризисом, когда мы создаем продукты быстрее, чем можем их эксплуатировать», — сказал он в той беседе.

Компания Resolve AI была основана в начале 2024 года Ксантосом и Агарвалом, которые познакомились во время обучения в аспирантуре Университета Иллинойса и работают вместе уже более десяти лет. Ранее Ксантос был соучредителем компаний Pattern Insight (приобретена VMware) и Omnition (приобретена Splunk), где они вместе создали OpenTelemetry. В 2024 году компания привлекла 35 миллионов долларов в рамках посевного раунда от Greylock, за которым последовал раунд серии A на 125 миллионов долларов, возглавляемый Lightspeed, при оценке в 1 миллиард долларов в начале этого года. Среди клиентов компании — Coinbase, DoorDash, MSCI, Salesforce, MongoDB и Zscaler.

Долгосрочная перспектива Ксантоса весьма масштабна. «В долгосрочной перспективе, как только возможности агента превзойдут возможности инженера-программиста, результатом станет гораздо больше технологий и гораздо больше программного обеспечения», — сказал он. «На самом деле, это не означает, что над этим работает меньше людей. Это означает, что технологии становятся дешевле, доступнее, и, следовательно, создается гораздо больше технологий на благо всего мира».

На реализацию этого видения уйдут годы. Но более непосредственная перспектива сегодняшнего объявления сводится к тому, что каждый дежурный инженер понимает на собственном опыте: вызов в 2 часа ночи, лихорадочная охота за ноутбуком, лихорадочный поиск ответа в панелях мониторинга и журналах, который может занять минуты или часы. Resolve AI рассчитывает, что в следующий раз, когда сработает такое оповещение, команда агентов уже проверит, подтвердит и задокументирует первопричину еще до того, как у инженера загорится индикатор на телефоне. Для профессии, которая долгое время измеряла свои ночи средним временем решения проблемы, вопрос больше не в том, может ли помочь ИИ, а в том, позволят ли ему это сделать инженеры.

Подпишитесь, чтобы получать самые свежие новости!

Подробные аналитические данные для руководителей предприятий в области искусственного интеллекта, данных и безопасности.

VB Daily AI Weekly Еженедельник AGI Еженедельник по безопасности Еженедельник по инфраструктуре данных Мероприятия VB Все они

Отправляя свой адрес электронной почты, вы соглашаетесь с нашими Условиями использования и Политикой конфиденциальности.

Получайте обновления ! Вы подписаны! Наши последние новости скоро поступят на вашу электронную почту.

Источник: venturebeat.com

✅ Найденные теги: Resolve, Бум, Компания, новости, Программирования, Утверждает

Добавить комментарий

Новости других рубрик

Архив рубрики ~Лента новостей~: 5 дополнительных важных концепций Python, которые необходимо знать Архив рубрики ~Лента новостей~: Что массовые увольнения в ClickUp говорят нам о будущем рынка труда Архив рубрики ~Лента новостей~: NeuralGCM использует искусственный интеллект для более точного моделирования долгосрочных глобальных осадков. Архив рубрики ~Лента новостей~: Умер Крейг Вентер, пионер и провидец в области геномики. Архив рубрики ~Лента новостей~: RAG в энтерпрайзе: почему демо работает, а прод нет Архив рубрики ~Лента новостей~: Компания Alibaba разрабатывает чипы с искусственным интеллектом, ориентированные на агентов, и это меняет суть гонки за лидерство. Архив рубрики ~Лента новостей~: Компания OpenAI совершила прорыв в решении математической задачи, существовавшей 80 лет. Архив рубрики ~Лента новостей~: Как добиться непостоянного момента?