Смогут ли технологические компании полюбить более дешевые модели искусственного интеллекта?

Бум искусственного интеллекта был основан на базовом предположении: чем больше модель, тем она мощнее, и побеждают самые мощные модели. Теперь же индустрия вот-вот узнает, что произойдет, если это предположение начнет нарушаться.
Рост цен уже заставил пользователей по-новому взглянуть на более компактные и дешевые модели. Такой подход к выбору экономичных моделей является новым, и пока неясно, как он повлияет на отрасль, но, вероятно, его влияние будет значительным.
Одно из предсказаний, лучше всего сформулированное соучредителем Coinbase Брайаном Армстронгом, заключается в том, что это приведет к переходу подавляющего большинства задач на более дешевые модели.
«[С]прос на интеллект практически бесконечен, но 80% рабочих нагрузок будут выполняться на моделях, которые на 99% дешевле, в течение 12-18 месяцев», — написал Армстронг на X. «20% рабочих нагрузок по-прежнему будут выполняться на моделях последнего поколения, где важна максимальная производительность интеллекта».
Трудно переоценить, насколько значительными будут изменения в индустрии искусственного интеллекта, если предсказание Армстронга сбудется.
Раньше большинство компаний, занимающихся ИИ, конкурировали по качеству, что означало использование самых передовых доступных моделей. Если те же задачи можно будет решать с помощью более дешевых моделей без ущерба для качества, это будет означать масштабный сдвиг в экономике ИИ. И что особенно важно, большая часть экономии придется на крупные лаборатории, что нанесет финансовый удар OpenAI и Anthropic как раз перед их IPO.
Это потенциально сейсмические изменения в отрасли, основанные на одном основном вопросе: готовы ли компании перейти на более компактные модели?
Первоначальные тесты показывают, что при правильной настройке системы более дешевые модели могут использоваться без ущерба для качества. В недавнем тесте, проведенном компанией Harvey, специализирующейся на юридическом ИИ, удалось снизить затраты на обработку данных в 3 раза без ущерба для качества. Тест, проведенный в партнерстве с платформой для обработки данных Fireworks AI, объединил Claude Opus и Fireworks GLM 5.1, при этом для наиболее ресурсоемких задач использовался Opus. В результате была достигнута значительно меньшая нагрузка на серверное время и общие затраты.
«Качество всегда на первом месте, и в юриспруденции так будет всегда», — сказал соучредитель Harvey Гейб Перейра в интервью TechCrunch, имея в виду юридические услуги, предоставляемые его стартапом с использованием искусственного интеллекта. «Однако определение качества меняется: от простого использования самой мощной модели для всего до использования лучшей модели, которая наиболее эффективно дает правильный ответ».
Эту тенденцию часто рассматривают в контексте противостояния крупных лабораторий и китайских или открытых производителей, но это упускает из виду более важный момент. Реальное различие заключается не в проприетарных и открытых моделях, а в больших и маленьких. Можно сэкономить, перейдя с GPT-5.5 на DeepSeek V4 Flash, но переход на GPT-5.4-mini даст такой же результат.
Между собственными разработками крупных лабораторий и независимыми моделями с открытыми весами идёт активная ценовая война. Что касается более важного вопроса о малых и больших моделях, то здесь не имеет значения, какая именно малая модель окажется более эффективной.
Всё это может показаться очевидным — конечно, не следует использовать больше вычислительных ресурсов, чем необходимо, — но это противоречит подходу, ориентированному на масштабирование, который доминировал в отрасли до сих пор. Вдохновлённые горьким уроком, лаборатории активно сосредоточились на обучении максимально ресурсоёмких моделей, расширяя границы возможностей моделей искусственного интеллекта. Благодаря значительным инвестициям и субсидированию цен, у клиентов не было причин выбирать что-либо, кроме самого передового варианта.
В условиях роста цен на токены и замедления темпов субсидирования пользователи впервые сталкиваются с ценовым давлением. Мы не знаем, приведет ли это новое ценовое давление к переходу корпоративных пользователей на более компактные модели. Они с таким же успехом могут сэкономить, сократив количество обращений, используя меньше контекста или просто отказавшись от наименее перспективных вариантов внедрения.
Но если окажется, что большинство развертываний можно успешно выполнить на более компактной модели, это может серьезно снизить растущий спрос на вывод результатов и поднять новые вопросы о том, как оправдать затраты на обучение перспективной модели.
Источник: techcrunch.com
Похожие записи
Похожие записи
Портативный ПК GPD WIN 5 получил белую версию со 128 Гбайтами памяти
12.11.2025
Выпускники колледжей отвергают любое упоминание об искусственном интеллекте, а генеральный директор Google пытается придумать, что сказать на предстоящем выпускном
05.06.2026
Катастрофа цифровой идентификации в Индии — предупреждение для всего мира
22.12.2025Подписка на рассылку
Получайте свежие новости и идеи на почту. Без спама — только самое интересное.
Нажимая «Подписаться», вы соглашаетесь с политикой конфиденциальности.
