Пришло время расплатиться за жетоны: внутри отрасли разворачивается борьба за управление стремительно растущими затратами на ИИ.
В масштабах всей отрасли компании начинают опасаться высокой стоимости ИИ. Uber исчерпал весь свой бюджет на разработку ИИ на 2026 год уже к апрелю. Microsoft отозвала лицензии Claude Code у своих разработчиков спустя несколько месяцев после их активации. Сотрудник Priceline сообщил TechCrunch, что обычное продление контракта на Cursor обходилось в 4-5 раз дороже.
Несмотря на падение цен за токен, стремление к более широкому внедрению ИИ и развитию автономных агентов привело к постоянному росту потребления токенов. Компании, которые в начале 2025 года налегали на подписки с неограниченным доступом, теперь пытаются понять, куда уходят их деньги, сократить расходы и выяснить, смогут ли они хоть как-то окупить свои инвестиции, несмотря на истощение бюджетов.
Тем временем формируется рынок, призванный удовлетворить их потребности. Стартапы, устоявшиеся поставщики и новая организация по стандартизации соревнуются в предоставлении компаниям инструментов и терминологии для отслеживания их расходов.
«Еще полгода назад, когда я разговаривал с клиентом, все сводилось к вопросу: „Что это может делать? Достаточно ли это хорошо?“», — рассказал Александр Эмбирикос, руководитель корпоративного направления OpenAI, изданию TechCrunch на мероприятии в Нью-Йорке на этой неделе. «Сейчас наши разговоры уже не касаются этого. Теперь мы говорим о том, „мы тратим так много. Какая у вас прозрачность? Какая у вас возможность аудита? Какие у вас механизмы контроля токенов? Какова эффективность ваших моделей?“»
Именно на этом фоне Linux Foundation на этой неделе представила планы по созданию Tokenomics Foundation, нового органа по стандартизации, цель которого — внедрить ту же дисциплину в отношении затрат на токены ИИ, которую FinOps применила к расходам на облачные сервисы.
«В апреле и мае я начал получать сообщения от компаний: „Боже мой, мы в три раза превысили весь наш бюджет токенов на 2026 год, и это только апрель“», — рассказал TechCrunch Джей Ар Стормент, исполнительный директор FinOps Foundation, проекта, входящего в состав Linux Foundation. «Мы начали слышать о кризисе существования, и весь разговор сместился с стремления к максимальной эффективности токенов и „быстрому развитию“ на „нам нужны механизмы контроля, как нам это контролировать?“»
В мире технологий раздались призывы, вызванные настойчивыми требованиями генеральных директоров, которые подталкивали свои команды к использованию лучших моделей и быстрому реагированию, невзирая на затраты. Новые модели, выпущенные в ноябре, такие как Claude Opus 4.5 от Anthropic, GPT-5.1 от OpenAI и Gemini 3 Pro от Google, значительно улучшили инструменты для работы с агентами, что привело к многократному увеличению их использования. Именно так, по сообщениям, одна компания оказалась с долгом в 500 миллионов долларов за использование Claude Opus после того, как забыла установить лимиты использования для сотрудников.
«Это как эпидемия крэк-кокаина», — сказал Крис Рид, старший директор по ИТ-финансам в Priceline, отметив, что компания начала устанавливать лимиты на количество токенов для определенных групп. «Они дают вам попробовать, чтобы вы подсели, и теперь вы в некотором роде от этого зависите».
Виталий Гордон, генеральный директор платформы для управления инженерными операциями Faros AI, рассказал, что недавно разговаривал с техническим директором, который сказал ему: «Один из моих инженеров потратил 40 000 долларов на токены в прошлом месяце, и я действительно не знаю, стоит ли мне его остановить или лучше рассказать всем остальным, чтобы они поступили так же».
Двухлетнее исследование 20 000 разработчиков, результаты которого были опубликованы компанией Faros в апреле, показало, что производительность растет, но при этом увеличивается и количество ошибок и переписываний кода. Аналогичным образом, платформа управления проектами Jellyfish обнаружила, что инженеры, использующие больше всего токенов, примерно вдвое продуктивнее тех, кто использует ИИ меньше, но при этом тратят в 10 раз больше токенов для достижения этого уровня.
Николас Арколано, руководитель исследовательского отдела Jellyfish, сообщил TechCrunch по электронной почте, что расходы на ИИ стремительно растут во многом благодаря агентным функциям, при этом потребление на одного разработчика увеличилось примерно в 18,6 раз за девять месяцев. В целом, эти статистические данные делают аргументы в пользу повышения производительности менее убедительными, чем показывают сами расходы.
«Окупаемость чрезмерных затрат зависит от конечной коммерческой ценности выпущенного кода (например, выручки), которую большинство компаний до сих пор не могут измерить», — сказал Арколано.
По крайней мере, часть проблем с измерением связана с огромными масштабами использования ИИ сегодня.
«Отслеживание затрат на облачные сервисы — это задача, требующая обработки сотен миллионов строк данных в месяц, — сказал Стормент. — Отслеживание затрат на токены — это задача, требующая обработки триллионов строк данных в месяц. Вы не можете просто вставить это в любую электронную таблицу или даже в самый простой инструмент. Вам нужно коренным образом переосмыслить свои инструменты, технические характеристики и системы учета, чтобы справиться с этим».
В Priceline Рид уже обнаружил несоответствия. Он отметил проблемы между данными об использовании, предоставленными поставщиком, и внутренними данными Priceline.
«Я начал свою карьеру в сфере управления расходами в телекоммуникационной отрасли, и вижу те же самые параллели: от телекоммуникаций до облачных технологий и искусственного интеллекта», — сказал он. «Всякий раз, когда вы внедряете что-то новое, это создает благодатную почву для ошибок в выставлении счетов, а также возможностей для аудита и оптимизации».
Вокруг этой проблемы начинает формироваться рынок. Есть компании, специализирующиеся исключительно на этом, такие как Pay-i, которые отслеживают, измеряют и оптимизируют затраты и производительность инвестиций в GenAI. Компания Paid, в свою очередь, позволяет разработчикам отслеживать затраты, измерять использование и выставлять счета пользователям на основе фактической ценности, а не абонентской платы.
Кроме того, есть такие компании, как Jellyfish, Waydev и Faros AI, которые предоставляют услуги мониторинга с помощью ИИ-агентов, что доказывает окупаемость инвестиций в инструменты для разработчиков. По словам Стормента, большинство из 180 поставщиков, входящих в FinOps Foundation, склоняются к этому направлению.
Компании с уже существующей дистрибуцией также добавляют новые функции, чтобы извлечь выгоду из этого нового рынка. Ramp недавно перешла к управлению расходами на ИИ; Datadog и New Relic добавили такие сервисы, как управление затратами на облачные ресурсы, мониторинг на уровне токенов и мониторинг графических процессоров. На конференции FinOps X на следующей неделе AWS, как ожидается, представит новые функции финансового управления, ориентированные на корпоративные расходы на ИИ.
Тиффани Лак, партнер NEA, считает, что эффективность токенов и наблюдаемость, скорее всего, будут добавлены на «уровне вспомогательного оборудования или приложения». Она привела в пример Factory, стартап, разрабатывающий ИИ-агентов для предприятий, который на этой неделе запустил маршрутизатор моделей, автоматически выбирающий подходящую модель для каждой задачи.
Гордон ожидает, что передовые лаборатории и другие поставщики моделей будут внедрять оптимизацию в стиле OpenRouter, чтобы направлять запросы к самым дешевым моделям — тенденция, которая уже наблюдается в счетах Claude для корпоративных клиентов.
«В финансовом отчете о том, сколько вы тратите на Anthropic, даже если вы используете модель Opus, часть средств будет направлена на сонеты или хайку, потому что они достаточно умны, чтобы это сделать», — сказал Гордон. «Я думаю, что это будет становиться все более распространенным явлением».
Однако все эти инструменты создаются без общего языка или общепринятых определений того, сколько стоит токен, что он производит и как сравнивать затраты разных поставщиков. Именно здесь Фонд токеномики надеется оказаться полезным.
Фонд разрабатывает каноническое определение и структуру для «токеномики»; открытые стандарты, спецификации и метрики для использования и выставления счетов за токены ИИ; а также новые метрики для экономики ИИ, такие как стоимость за интеллект или токены за ватт. Он также планирует определить метрики эффективности фабрик токенов и эффективности потребления. Группа планирует официальный запуск в июле и собирается объявить о новых членах на конференции FinOps X на следующей неделе.
«Токеномика принципиально более абстрактна и непрозрачна, чем все, с чем мы сталкивались в таком масштабе раньше», — заявил в своем заявлении Нишант Гупта, директор по доступности в Salesforce. «Она требует иных операционных возможностей, чем те, которые отрасль создала для облачных вычислений».
Тем не менее, по прогнозам Goldman Sachs, к 2030 году глобальное использование токенов увеличится в 24 раза. Компаниям, уже превысившим бюджет, решения нужны уже сейчас, а до первого результата работы фонда ещё несколько месяцев.
«Возможно, мы создали паровой двигатель, но мы до сих пор не придумали конвейерное производство», — сказал Гордон.
По мнению Арколано, разумным шагом будет широкое и умеренное внедрение.
«Наилучшая окупаемость инвестиций достигается за счет перевода широкого среднего класса из категории пользователей с низким уровнем использования в категорию умеренного, а не за счет увеличения числа активных пользователей», — сказал он.
В подготовке этого материала принимали участие Рассел Брэндом и Тим Фернхольц.
Источник: techcrunch.com

Добавить комментарий
Для отправки комментария вам необходимо авторизоваться.