Архив рубрики ~Лента новостей~

Анализ финансовой устойчивости ИИ.

Анализ финансовой устойчивости ИИ.
Анализ финансовой устойчивости ИИ.

Бюджеты для токенов ИИ не могут быть бесконечными, как бы ни хотели этого крупные провайдеры.

Делиться

Фото Иммо Вегманна на Unsplash

В своей апрельской колонке я говорил о том, что непрозрачность истинной стоимости ИИ является потенциально фатальным недостатком для прибыльной коммерциализации этой технологии в долгосрочной перспективе. Интересно, что за прошедшие два месяца мы увидели несколько примечательных заголовков из технологической индустрии, которые, возможно, подтверждают мой аргумент в катастрофических масштабах.

Кажется, что в индустрии ИИ ветер так быстро меняет направление, что за всем этим трудно уследить. Еще несколько месяцев назад технологические компании и даже некоторые другие предприятия активно подталкивали сотрудников к более активному использованию ИИ, требуя от команд интеграции его в рабочие процессы, независимо от того, была ли у них явная необходимость или особое желание использовать это программное обеспечение.

Задним умом все умны.

Как, вероятно, мог предсказать любой, кто об этом задумывался, когда материальные средства к существованию людей привязаны к более частому использованию чего-либо, значительная часть людей действительно будет использовать это чаще. Это привело к «токенмаксингу», рейтингам использования токенов внутри таких компаний, как Amazon, и шокирующим квартальным показателям расходов на токены ИИ во многих местах, таких как Uber (и других компаниях, которые не желают называть свои имена). Честно говоря, мне непонятно, почему эти компании удивлены такими результатами, но тем не менее, это привело к изменению инструкций для персонала, как потому что эти затраты неустойчивы в течение длительного времени, так и потому что использование ИИ не принесло достаточно впечатляющих бизнес-результатов.

Вполне возможно, что руководство полагало, что использование ИИ приведет к какому-то получудесному взрывному росту производительности, но если это так, то они действительно не провели должного исследования. Многие из нас, работающих в этой области, а также представители СМИ, освещающие отрасль, предупреждали о том, что ИИ — это инструмент, который можно использовать эффективно или неэффективно, и что ожидание чудес всегда приведет к разочарованию.

Я уже использовал подобную метафору, но представьте, что эти компании работают в строительстве, и вот недавно изобретены электрические дрели, позволяющие значительно повысить производительность труда в строительстве. Правильной реакцией было бы не скупать как можно больше дрелей, доводя их комплектующие до дефицита и завышая цены, и не инструктировать персонал использовать дрель при выполнении каждой задачи, не создавая табло, показывающих, кто использовал дрели больше всего минут в день. В результате здания превратились бы в решето из отверстий, на дрели и электроэнергию для их питания были бы потрачены огромные суммы, а результаты были бы примерно такими же, как у современных технологических компаний от искусственного интеллекта.

Деньги не бесконечны

В любом случае, реальность начала рушиться, и это, по крайней мере, было быстрым возвращением к реальности. Некоторые компании всё ещё покупают буровые установки, но крупные игроки заметили, что соотношение затрат и выгод здесь не оправдывает себя, и корректируют свою стратегию. Однако, как я объяснил в апреле, это будет не так просто, как они думают. Некоторые компании начинают говорить своим командам, что использование ИИ должно быть направлено на достижение плодотворных результатов, а не просто на максимизацию прибыли, чтобы попытаться снизить затраты, одновременно извлекая выгоду из технологии там, где она может приносить пользу.

Они пока не понимают, что планирование бюджета на токены и четкое определение того, когда ИИ поможет решить проблему, — задача гораздо более неопределенная, чем использование других видов технологий. Давайте вернемся к моей апрельской статье и вспомним опыт использования ИИ для отдельных лиц.

«[В]незапно вы можете контролировать количество отправляемых токенов и, следовательно, свои затраты, но этот контроль ограничен. Вы можете делать свои запросы краткими, ограничивать лишние инструкции и, как следствие, снижать затраты на ввод. Однако, когда в дело вступают агентные инструменты, и LLM формирует запросы для передачи другим LLM, вы больше не контролируете длину запросов. Что еще более важно, вы имеете лишь минимальный контроль над количеством токенов, которые отвечает любая модель (например, попросив ее «быть краткой»). По большей части, количество выходных токенов является частью той недетерминированной неизвестной величины, которую я описывал ранее. И, обратите внимание, выходной токен стоит в 5 раз дороже входного токена».

Чтобы развить эту мысль дальше, следует отметить, что при использовании ИИ всегда существует вероятность того, что он не сможет дать успешный ответ на ваш вопрос. Таким образом, компонент игрового автомата усугубляет проблему. Специалист по информационным технологиям не знает: А. сколько токенов вернет любой запрос или Б. сколько раз нужно будет ввести запрос (возможно, с изменениями), чтобы получить успешный ответ на вопрос. Для расчета стоимости нам нужно сложить все количества токенов входных запросов и все количества токенов выходных запросов (А, которое неизвестно) на величину количества необходимых попыток (Б, которое также неизвестно). А и Б варьируются неопределенно в зависимости от архитектуры модели, решаемой задачи, случайности в модели и других факторов, о которых мы, вероятно, даже не знаем. Затем мы умножаем на цену за токен для используемой модели или моделей, которая, как я объяснил в апреле, также варьируется.

Итак, если вы работаете в финансовом отделе технологической компании и вам нужно определить бюджет в долларах на токены ИИ на следующий год, я желаю вам всяческих успехов. Даже если вы будете оценивать бюджет, основываясь на прошлом использовании или с учетом очень подробной информации о целях компании в области производительности, ваши шансы на правильное планирование кажутся мне довольно малы. Однако вам нужно установить какой-то лимит, это не может быть ситуация с неограниченными средствами, поэтому вам придется в какой-то момент прекратить финансирование сотрудников.

Практические последствия

Как это будет работать на практике? Будет ли это «ручное программирование» во второй половине года, после того как в первой половине года мы интенсивно использовали ИИ? Будут ли все наши электронные письма и маркетинговые документы написаны вручную в третьем и четвертом кварталах? Будем ли мы отключать наши инструменты транскрипции ИИ и программное обеспечение для преобразования голоса в текст после достижения определенного порога? Для меня это очень интересный вопрос, потому что я лично убедился, насколько сильно отличается опыт написания кода с использованием ИИ от написания кода без него, и переключение между этими двумя процессами было бы невероятно деструктивным.

Это также поднимает вопрос о том, как сокращение затрат на ИИ повлияет на компании, предоставляющие решения на основе ИИ. В октябре прошлого года я обсуждал, как крупные облачные провайдеры (Anthropic, OpenAI, Google и др.) подталкивают стартапы к внедрению функций на основе ИИ в свои продукты, пытаясь получить прибыль для возврата инвесторам, вложившим в эту отрасль миллиарды долларов. По мере роста стоимости предоставления функций ИИ и перехода компаний к модели оплаты по факту использования, этот механизм начнет рушиться. Если компании начнут меньше использовать инструменты на основе ИИ, потому что их бюджеты не могут покрыть растущие затраты, поток доходов для крупных облачных провайдеров иссякнет. Anthropic и OpenAI планируют IPO в этом году, обе компании имеют крайне неопределенные перспективы получения прибыли и сотни миллиардов долларов, которые им должны инвесторы, поэтому замедление использования ИИ — это последнее, что им нужно.

Стоит также отметить, что на прошлой неделе на WWDC компания Apple анонсировала свой шаг в области искусственного интеллекта, и критики пока реагируют на это довольно позитивно. Новая Siri, использующая технологию Google Gemini, будет иметь существенную защиту конфиденциальности (на устройстве и в частном облаке, а также минимальное хранилище данных) и не будет стоить пользователям дополнительных денег. При наличии такой возможности и если качество окажется на должном уровне, обычное использование ChatGPT и Claude может оказаться под угрозой.

Заключение

Следите за обновлениями, потому что, хотя истории о «компаниях, шокированных законопроектами об ИИ» и «OpenAI и Anthropic готовятся к крупнейшим IPO в истории» часто освещаются отдельно, на самом деле это одна и та же история, рассказанная с разных сторон. Даже если технологические компании считают, что ИИ приносит им пользу и повышает производительность, у них просто нет неограниченных бюджетов для его применения. Если у них нет неограниченных бюджетов (а у потребителей их, безусловно, нет, поскольку цены на товары повседневного спроса создают нагрузку на бюджеты, а экономические настроения находятся на самом низком уровне за почти столетие наблюдений), мы должны вернуться к вопросу о том, откуда возьмутся миллиарды и миллиарды, которые, как ожидают OpenAI, Anthropic и другие, принесут доход. Добавьте к этому общественное противодействие центрам обработки данных и негативное отношение к ИИ в целом, и у гипермасштабных компаний возникнет серьезная проблема.

Больше моих работ вы можете найти на сайте www.stephaniekirmer.com

Дополнительная литература

https://medium.com/@s.kirmer/can-we-save-the-ai-economy-b431b1f62f93

https://medium.com/@s.kirmer/the-llm-gamble-cc434c5a9f54

https://www.businessinsider.com/disney-ai-push-increase-velocity-tech-employees-tokenmaxxing-josh-damaro-2026-6

https://www.businessinsider.com/ai-spending-roi-concerns-tokenmaxxing-uber-coo-andrew-macdonald-reaction-2026-5

https://gizmodo.com/big-tech-is-quietly-admitting-that-if-it-wants-to-sell-people-on-ai-it-better-be-cheap-2000768710

https://tech.yahoo.com/ai/articles/amazon-latest-tech-giant-face-212500092.html

https://www.inc.com/georgia-fearn/palantir-ceo-just-accused-ai-labs-of-tokenmaxxing-at-corporate-companies-expense/91359321

https://www.businessinsider.com/meta-google-jpmorgan-make-ai-performance-reviews-goals-raises-promotions-2026-3

https://www.theverge.com/tech/949502/apple-macos-27-golden-gate-siri-ai-apple-intelligence

https://www.theverge.com/tech/947432/siri-ai-apple-intelligence-ios-27-wwdc

https://gizmodo.com/americans-are-starting-to-really-hate-data-centers-and-its-making-the-tech-industry-nervous-2000767088

https://gizmodo.com/companies-are-getting-burned-by-burning-tons-of-tokens-2000765232

Стефани Кирмер. Все работы Стефани Кирмер.

Источник: towardsdatascience.com

❌ Нет похожих статей с такими тегами

Оцените материал:

Поделиться
Понравилась статья? Расскажите другим
ВКонтакте
Читайте также
Архив рубрики ~Коротко из Telegram~ Разбираемся в чужом коде за считанные МИНУТЫ — на GitHub… Архив рубрики ~Обо всем~ В Великобритании запретят социальные сети для детей младше 16 лет и могут ввести комендантский час в ночное время. Архив рубрики ~Коротко из Telegram~ Если ваш Mac греется и батарея тает на глазах, попробуйте… Архив рубрики ~Коротко из Telegram~ ExcelDashboardAI — помощник для анализа данных на основе искусственного интеллекта…. Архив рубрики ~Коротко из Telegram~ Превращаем своего агента в ленивого синьора — скилл Ponytail для… Архив рубрики ~Коротко из Telegram~ 🛡ИИ, как защита В новостях все чаще мелькают страшилки о… Архив рубрики ~Коротко из Telegram~ KPMG отозвала отчёт про пользу агентного ИИ — его подвёл… Архив рубрики ~Идей копилка~ Как заработать на нейросетях: создаем карточки товаров для маркетплейсов и выходим на 50к+ Архив рубрики ~Обо всем~ Linux 7.1 положит конец эре процессоров Intel 486 и проведет серьезную очистку от устаревших файлов. Архив рубрики ~Коротко из Telegram~ 🚨 На конференции AgentCon спикеры призвали разработчиков перестать использовать ИИ… Архив рубрики ~Коротко из Telegram~ Скидываем рутину на ИИ как профи — появился сайт с… Архив рубрики ~Обо всем~ На Лондонской неделе технологий Великобритания представила план развития инфраструктуры искусственного интеллекта – каковы его результаты? Архив рубрики ~Обо всем~ [Перевод] Эксперименты с водородом поставили под сомнение гипотезу о квантовых червоточинах Архив рубрики ~Обо всем~ Модули памяти DDR5 продолжают дорожать, но с нюансом Архив рубрики ~Коротко из Telegram~ Разбираемся в чужом коде за считанные МИНУТЫ — на GitHub… Архив рубрики ~Обо всем~ В Великобритании запретят социальные сети для детей младше 16 лет и могут ввести комендантский час в ночное время. Архив рубрики ~Коротко из Telegram~ Если ваш Mac греется и батарея тает на глазах, попробуйте… Архив рубрики ~Коротко из Telegram~ ExcelDashboardAI — помощник для анализа данных на основе искусственного интеллекта…. Архив рубрики ~Коротко из Telegram~ Превращаем своего агента в ленивого синьора — скилл Ponytail для… Архив рубрики ~Коротко из Telegram~ 🛡ИИ, как защита В новостях все чаще мелькают страшилки о… Архив рубрики ~Коротко из Telegram~ KPMG отозвала отчёт про пользу агентного ИИ — его подвёл… Архив рубрики ~Идей копилка~ Как заработать на нейросетях: создаем карточки товаров для маркетплейсов и выходим на 50к+ Архив рубрики ~Обо всем~ Linux 7.1 положит конец эре процессоров Intel 486 и проведет серьезную очистку от устаревших файлов. Архив рубрики ~Коротко из Telegram~ 🚨 На конференции AgentCon спикеры призвали разработчиков перестать использовать ИИ… Архив рубрики ~Коротко из Telegram~ Скидываем рутину на ИИ как профи — появился сайт с… Архив рубрики ~Обо всем~ На Лондонской неделе технологий Великобритания представила план развития инфраструктуры искусственного интеллекта – каковы его результаты? Архив рубрики ~Обо всем~ [Перевод] Эксперименты с водородом поставили под сомнение гипотезу о квантовых червоточинах Архив рубрики ~Обо всем~ Модули памяти DDR5 продолжают дорожать, но с нюансом

Оставить комментарий