Архив рубрики ~Лента новостей~

Смогут ли технологические компании полюбить более дешевые модели искусственного интеллекта?

Смогут ли технологические компании полюбить более дешевые модели искусственного интеллекта?
Источник изображения: Михаил Коноплев / Getty Images

Бум искусственного интеллекта был основан на базовом предположении: чем больше модель, тем она мощнее, и побеждают самые мощные модели. Теперь же индустрия вот-вот узнает, что произойдет, если это предположение начнет нарушаться.

Рост цен уже заставил пользователей по-новому взглянуть на более компактные и дешевые модели. Такой подход к выбору экономичных моделей является новым, и пока неясно, как он повлияет на отрасль, но, вероятно, его влияние будет значительным.

Одно из предсказаний, лучше всего сформулированное соучредителем Coinbase Брайаном Армстронгом, заключается в том, что это приведет к переходу подавляющего большинства задач на более дешевые модели.

«[С]прос на интеллект практически бесконечен, но 80% рабочих нагрузок будут выполняться на моделях, которые на 99% дешевле, в течение 12-18 месяцев», — написал Армстронг на X. «20% рабочих нагрузок по-прежнему будут выполняться на моделях последнего поколения, где важна максимальная производительность интеллекта».

Трудно переоценить, насколько значительными будут изменения в индустрии искусственного интеллекта, если предсказание Армстронга сбудется.

Раньше большинство компаний, занимающихся ИИ, конкурировали по качеству, что означало использование самых передовых доступных моделей. Если те же задачи можно будет решать с помощью более дешевых моделей без ущерба для качества, это будет означать масштабный сдвиг в экономике ИИ. И что особенно важно, большая часть экономии придется на крупные лаборатории, что нанесет финансовый удар OpenAI и Anthropic как раз перед их IPO.

Это потенциально сейсмические изменения в отрасли, основанные на одном основном вопросе: готовы ли компании перейти на более компактные модели?

Первоначальные тесты показывают, что при правильной настройке системы более дешевые модели могут использоваться без ущерба для качества. В недавнем тесте, проведенном компанией Harvey, специализирующейся на юридическом ИИ, удалось снизить затраты на обработку данных в 3 раза без ущерба для качества. Тест, проведенный в партнерстве с платформой для обработки данных Fireworks AI, объединил Claude Opus и Fireworks GLM 5.1, при этом для наиболее ресурсоемких задач использовался Opus. В результате была достигнута значительно меньшая нагрузка на серверное время и общие затраты.

«Качество всегда на первом месте, и в юриспруденции так будет всегда», — сказал соучредитель Harvey Гейб Перейра в интервью TechCrunch, имея в виду юридические услуги, предоставляемые его стартапом с использованием искусственного интеллекта. «Однако определение качества меняется: от простого использования самой мощной модели для всего до использования лучшей модели, которая наиболее эффективно дает правильный ответ».

Эту тенденцию часто рассматривают в контексте противостояния крупных лабораторий и китайских или открытых производителей, но это упускает из виду более важный момент. Реальное различие заключается не в проприетарных и открытых моделях, а в больших и маленьких. Можно сэкономить, перейдя с GPT-5.5 на DeepSeek V4 Flash, но переход на GPT-5.4-mini даст такой же результат.

Между собственными разработками крупных лабораторий и независимыми моделями с открытыми весами идёт активная ценовая война. Что касается более важного вопроса о малых и больших моделях, то здесь не имеет значения, какая именно малая модель окажется более эффективной.

Всё это может показаться очевидным — конечно, не следует использовать больше вычислительных ресурсов, чем необходимо, — но это противоречит подходу, ориентированному на масштабирование, который доминировал в отрасли до сих пор. Вдохновлённые горьким уроком, лаборатории активно сосредоточились на обучении максимально ресурсоёмких моделей, расширяя границы возможностей моделей искусственного интеллекта. Благодаря значительным инвестициям и субсидированию цен, у клиентов не было причин выбирать что-либо, кроме самого передового варианта.

В условиях роста цен на токены и замедления темпов субсидирования пользователи впервые сталкиваются с ценовым давлением. Мы не знаем, приведет ли это новое ценовое давление к переходу корпоративных пользователей на более компактные модели. Они с таким же успехом могут сэкономить, сократив количество обращений, используя меньше контекста или просто отказавшись от наименее перспективных вариантов внедрения.

Но если окажется, что большинство развертываний можно успешно выполнить на более компактной модели, это может серьезно снизить растущий спрос на вывод результатов и поднять новые вопросы о том, как оправдать затраты на обучение перспективной модели.

Источник: techcrunch.com

Оцените материал:

Читайте также
Архив рубрики ~Коротко из Telegram~ 🚨 На конференции AgentCon спикеры призвали разработчиков перестать использовать ИИ… Архив рубрики ~Коротко из Telegram~ Скидываем рутину на ИИ как профи — появился сайт с… Архив рубрики ~Обо всем~ На Лондонской неделе технологий Великобритания представила план развития инфраструктуры искусственного интеллекта – каковы его результаты? Архив рубрики ~Обо всем~ [Перевод] Эксперименты с водородом поставили под сомнение гипотезу о квантовых червоточинах Архив рубрики ~Обо всем~ Модули памяти DDR5 продолжают дорожать, но с нюансом Архив рубрики ~Обо всем~ Компания Commodore выпустила телефон-раскладушку, позволяющий отказаться от социальных сетей. Новости робототехники Репортаж с ICRA 2026 из Вены Архив рубрики ~Обо всем~ Компания SpaceX покупает стартап Cursor, занимающийся разработкой программного обеспечения для искусственного интеллекта, за 60 миллиардов долларов. Новости робототехники Интернет Архив рубрики ~Обо всем~ Китайские материаловеды разработали санскрин для перовскитных солнечных элементов. Больше всего от излучения страдал тонкий транспортный слой Архив рубрики ~Обо всем~ Формула-1 в Испании: Стратегическая борьба в старом стиле по-прежнему может быть захватывающей. Новости робототехники Морские хищники: новейшие российские БЭКи и подводные дроны представили в Кронштадте Архив рубрики ~Обо всем~ Прошивка AMD AGESA 1.3.0.1b прилично снижает напряжение оперативной памяти Новости робототехники Компания Mobileye, поставщик технологий для беспилотных автомобилей, хочет снова стать частью революции роботакси. Архив рубрики ~Коротко из Telegram~ 🚨 На конференции AgentCon спикеры призвали разработчиков перестать использовать ИИ… Архив рубрики ~Коротко из Telegram~ Скидываем рутину на ИИ как профи — появился сайт с… Архив рубрики ~Обо всем~ На Лондонской неделе технологий Великобритания представила план развития инфраструктуры искусственного интеллекта – каковы его результаты? Архив рубрики ~Обо всем~ [Перевод] Эксперименты с водородом поставили под сомнение гипотезу о квантовых червоточинах Архив рубрики ~Обо всем~ Модули памяти DDR5 продолжают дорожать, но с нюансом Архив рубрики ~Обо всем~ Компания Commodore выпустила телефон-раскладушку, позволяющий отказаться от социальных сетей. Новости робототехники Репортаж с ICRA 2026 из Вены Архив рубрики ~Обо всем~ Компания SpaceX покупает стартап Cursor, занимающийся разработкой программного обеспечения для искусственного интеллекта, за 60 миллиардов долларов. Новости робототехники Интернет Архив рубрики ~Обо всем~ Китайские материаловеды разработали санскрин для перовскитных солнечных элементов. Больше всего от излучения страдал тонкий транспортный слой Архив рубрики ~Обо всем~ Формула-1 в Испании: Стратегическая борьба в старом стиле по-прежнему может быть захватывающей. Новости робототехники Морские хищники: новейшие российские БЭКи и подводные дроны представили в Кронштадте Архив рубрики ~Обо всем~ Прошивка AMD AGESA 1.3.0.1b прилично снижает напряжение оперативной памяти Новости робототехники Компания Mobileye, поставщик технологий для беспилотных автомобилей, хочет снова стать частью революции роботакси.

Оставить комментарий