Архив рубрики ~Лента новостей~

Смогут ли технологические компании полюбить более дешевые модели искусственного интеллекта?

Смогут ли технологические компании полюбить более дешевые модели искусственного интеллекта?
Современный центр обработки данных с серверами, оснащенными подсветкой.
Источник изображения: Михаил Коноплев / Getty Images

Бум искусственного интеллекта был основан на базовом предположении: чем больше модель, тем она мощнее, и побеждают самые мощные модели. Теперь же индустрия вот-вот узнает, что произойдет, если это предположение начнет нарушаться.

Рост цен уже заставил пользователей по-новому взглянуть на более компактные и дешевые модели. Такой подход к выбору экономичных моделей является новым, и пока неясно, как он повлияет на отрасль, но, вероятно, его влияние будет значительным.

Одно из предсказаний, лучше всего сформулированное соучредителем Coinbase Брайаном Армстронгом, заключается в том, что это приведет к переходу подавляющего большинства задач на более дешевые модели.

«[С]прос на интеллект практически бесконечен, но 80% рабочих нагрузок будут выполняться на моделях, которые на 99% дешевле, в течение 12-18 месяцев», — написал Армстронг на X. «20% рабочих нагрузок по-прежнему будут выполняться на моделях последнего поколения, где важна максимальная производительность интеллекта».

Трудно переоценить, насколько значительными будут изменения в индустрии искусственного интеллекта, если предсказание Армстронга сбудется.

Раньше большинство компаний, занимающихся ИИ, конкурировали по качеству, что означало использование самых передовых доступных моделей. Если те же задачи можно будет решать с помощью более дешевых моделей без ущерба для качества, это будет означать масштабный сдвиг в экономике ИИ. И что особенно важно, большая часть экономии придется на крупные лаборатории, что нанесет финансовый удар OpenAI и Anthropic как раз перед их IPO.

Это потенциально сейсмические изменения в отрасли, основанные на одном основном вопросе: готовы ли компании перейти на более компактные модели?

Первоначальные тесты показывают, что при правильной настройке системы более дешевые модели могут использоваться без ущерба для качества. В недавнем тесте, проведенном компанией Harvey, специализирующейся на юридическом ИИ, удалось снизить затраты на обработку данных в 3 раза без ущерба для качества. Тест, проведенный в партнерстве с платформой для обработки данных Fireworks AI, объединил Claude Opus и Fireworks GLM 5.1, при этом для наиболее ресурсоемких задач использовался Opus. В результате была достигнута значительно меньшая нагрузка на серверное время и общие затраты.

«Качество всегда на первом месте, и в юриспруденции так будет всегда», — сказал соучредитель Harvey Гейб Перейра в интервью TechCrunch, имея в виду юридические услуги, предоставляемые его стартапом с использованием искусственного интеллекта. «Однако определение качества меняется: от простого использования самой мощной модели для всего до использования лучшей модели, которая наиболее эффективно дает правильный ответ».

Эту тенденцию часто рассматривают в контексте противостояния крупных лабораторий и китайских или открытых производителей, но это упускает из виду более важный момент. Реальное различие заключается не в проприетарных и открытых моделях, а в больших и маленьких. Можно сэкономить, перейдя с GPT-5.5 на DeepSeek V4 Flash, но переход на GPT-5.4-mini даст такой же результат.

Между собственными разработками крупных лабораторий и независимыми моделями с открытыми весами идёт активная ценовая война. Что касается более важного вопроса о малых и больших моделях, то здесь не имеет значения, какая именно малая модель окажется более эффективной.

Всё это может показаться очевидным — конечно, не следует использовать больше вычислительных ресурсов, чем необходимо, — но это противоречит подходу, ориентированному на масштабирование, который доминировал в отрасли до сих пор. Вдохновлённые горьким уроком, лаборатории активно сосредоточились на обучении максимально ресурсоёмких моделей, расширяя границы возможностей моделей искусственного интеллекта. Благодаря значительным инвестициям и субсидированию цен, у клиентов не было причин выбирать что-либо, кроме самого передового варианта.

В условиях роста цен на токены и замедления темпов субсидирования пользователи впервые сталкиваются с ценовым давлением. Мы не знаем, приведет ли это новое ценовое давление к переходу корпоративных пользователей на более компактные модели. Они с таким же успехом могут сэкономить, сократив количество обращений, используя меньше контекста или просто отказавшись от наименее перспективных вариантов внедрения.

Но если окажется, что большинство развертываний можно успешно выполнить на более компактной модели, это может серьезно снизить растущий спрос на вывод результатов и поднять новые вопросы о том, как оправдать затраты на обучение перспективной модели.

Источник: techcrunch.com

✅ Найденные теги: Более, Компании, новости, Полюбить, Смогут, Технологические
Читайте также
Архив рубрики ~Обо всем~ Специальность «Информатика» никуда не исчезла. Архив рубрики ~Обо всем~ Silent Hill Townfall переносит атмосферный хоррор в Шотландию 90-х годов с невероятным вниманием к деталям. Архив рубрики ~Обо всем~ Лучшие предложения стриминговых сервисов для студентов: Spotify, Hulu, HBO Max и другие. Архив рубрики ~Обо всем~ Предварительное заполнение один раз, распространение по сети: обмен снимками ключ-значение для многоагентных конвейеров обработки данных LLM. Архив рубрики ~Обо всем~ В Grave Seasons к уютным механикам фермерства и дружбы добавляются элементы детектива и расследования убийств. Архив рубрики ~Коротко из Telegram~ Собираем собственный ИИ-офис — инструмент Agent Teams запускает целую команду… Архив рубрики ~Коротко из Telegram~ ❗️Krea презентовали сразу несколько обновлений и это стоит разобрать ⚡️Krea… Архив рубрики ~Коротко из Telegram~ 😈 Пока индустрия обсуждает новые модели и агентные фреймворки, исследователи… Архив рубрики ~Коротко из Telegram~ Высыпаться можно будет, не засыпая: учёные научились включать в бодрствующем… Архив рубрики ~Коротко из Telegram~ За четыре дня в ИИ-рынке сошлось столько плохих новостей, что… Архив рубрики ~Коротко из Telegram~ NVIDIA тащит ИИ из облака прямо в ноутбуки На Computex… Архив рубрики ~Коротко из Telegram~ Дейтинг в 2026 всё больше похож на симулятор одиночества Пока… Архив рубрики ~Коротко из Telegram~ GPU уже не главный стоп-кран для ИИ в бизнесе Миф… Архив рубрики ~Коротко из Telegram~ Ян Лекун снова хоронит LLM Ян Лекун в свежем интервью… Архив рубрики ~Обо всем~ Специальность «Информатика» никуда не исчезла. Архив рубрики ~Обо всем~ Silent Hill Townfall переносит атмосферный хоррор в Шотландию 90-х годов с невероятным вниманием к деталям. Архив рубрики ~Обо всем~ Лучшие предложения стриминговых сервисов для студентов: Spotify, Hulu, HBO Max и другие. Архив рубрики ~Обо всем~ Предварительное заполнение один раз, распространение по сети: обмен снимками ключ-значение для многоагентных конвейеров обработки данных LLM. Архив рубрики ~Обо всем~ В Grave Seasons к уютным механикам фермерства и дружбы добавляются элементы детектива и расследования убийств. Архив рубрики ~Коротко из Telegram~ Собираем собственный ИИ-офис — инструмент Agent Teams запускает целую команду… Архив рубрики ~Коротко из Telegram~ ❗️Krea презентовали сразу несколько обновлений и это стоит разобрать ⚡️Krea… Архив рубрики ~Коротко из Telegram~ 😈 Пока индустрия обсуждает новые модели и агентные фреймворки, исследователи… Архив рубрики ~Коротко из Telegram~ Высыпаться можно будет, не засыпая: учёные научились включать в бодрствующем… Архив рубрики ~Коротко из Telegram~ За четыре дня в ИИ-рынке сошлось столько плохих новостей, что… Архив рубрики ~Коротко из Telegram~ NVIDIA тащит ИИ из облака прямо в ноутбуки На Computex… Архив рубрики ~Коротко из Telegram~ Дейтинг в 2026 всё больше похож на симулятор одиночества Пока… Архив рубрики ~Коротко из Telegram~ GPU уже не главный стоп-кран для ИИ в бизнесе Миф… Архив рубрики ~Коротко из Telegram~ Ян Лекун снова хоронит LLM Ян Лекун в свежем интервью…

Оставить комментарий

Подписка на рассылку

Получайте свежие новости и идеи на почту. Без спама — только самое интересное.

Нажимая «Подписаться», вы соглашаетесь с политикой конфиденциальности.