Image

Эта «дешевая» модель ИИ с открытым исходным кодом на самом деле сжигает ваш вычислительный бюджет

Источник: VentureBeat, создано с помощью Midjourney Источник: VentureBeat, создано с помощью Midjourney

Хотите получать более ценную информацию? Подпишитесь на наши еженедельные рассылки, чтобы получать только то, что важно для руководителей в сфере корпоративного ИИ, данных и безопасности. Подпишитесь сейчас

Новое комплексное исследование показало, что модели искусственного интеллекта с открытым исходным кодом потребляют значительно больше вычислительных ресурсов, чем их конкуренты с закрытым исходным кодом при выполнении идентичных задач, что потенциально подрывает их ценовые преимущества и меняет подход предприятий к оценке стратегий развертывания ИИ.

Исследование, проведённое компанией Nous Research, специализирующейся на искусственном интеллекте, показало, что модели с открытыми весами используют в 1,5–4 раза больше токенов — базовых единиц вычислений ИИ — чем закрытые модели, такие как OpenAI и Anthropic. В случае простых вопросов на знания разрыв значительно увеличивался: некоторые открытые модели использовали до 10 раз больше токенов.

«Открытые модели веса используют в 1,5–4 раза больше токенов, чем закрытые (до 10 раз для простых вопросов на знания), что иногда делает их более дорогими в расчете на запрос, несмотря на более низкие затраты на токен», — написали исследователи в своем отчете, опубликованном в среду.

Результаты исследования ставят под сомнение устоявшееся в индустрии ИИ предположение о том, что модели с открытым исходным кодом обладают явными экономическими преимуществами по сравнению с проприетарными аналогами. Хотя запуск моделей с открытым исходным кодом обычно обходится дешевле в расчёте на токен, исследование предполагает, что это преимущество может быть «легко нивелировано, если для решения конкретной задачи требуется больше токенов».

Масштабирование ИИ достигает предела

Ограничения мощности, рост стоимости токенов и задержки в выводе данных меняют корпоративный ИИ. Присоединяйтесь к нашему эксклюзивному салону, чтобы узнать, как обстоят дела у лучших команд:

  • Превращение энергии в стратегическое преимущество
  • Разработка эффективного вывода для реального увеличения пропускной способности
  • Обеспечение конкурентоспособной рентабельности инвестиций с помощью устойчивых систем ИИ

Забронируйте свое место, чтобы оставаться впереди : https://bit.ly/4mwGngO

Реальная стоимость ИИ: почему «более дешевые» модели могут разорить ваш бюджет

В исследовании были рассмотрены 19 различных моделей ИИ для трёх категорий задач: вопросы на базовые знания, математические задачи и логические головоломки. Команда измеряла «эффективность токенов» — количество вычислительных единиц, используемых моделями, по отношению к сложности их решений. Эта метрика мало изучена систематически, несмотря на её значительные финансовые последствия.

«Эффективность токенов — критически важный показатель по нескольким практическим причинам», — отметили исследователи. «Хотя хостинг открытых весовых моделей может быть дешевле, это преимущество в стоимости может быть легко нивелировано, если для решения конкретной задачи потребуется больше токенов».

88e7bfea6d571309f0204eabb9826fb4
Модели ИИ с открытым исходным кодом используют до 12 раз больше вычислительных ресурсов, чем самые эффективные закрытые модели для решения базовых вопросов знаний. (Источник: Nous Research)

Эта неэффективность особенно ярко проявляется в случае больших моделей рассуждений (LRM), которые используют развёрнутые «цепочки мыслей» для решения сложных задач. Эти модели, предназначенные для пошагового решения задач, могут потреблять тысячи токенов для решения простых вопросов, требующих минимального объёма вычислений.

Исследование показало, что для базовых вопросов на знания, таких как «Какая столица Австралии?», модели рассуждения тратят «сотни токенов на обдумывание простых вопросов на знания», на которые можно ответить одним словом.

Какие модели ИИ действительно дают максимальную отдачу от ваших вложений

Исследование выявило существенные различия между поставщиками моделей. Модели OpenAI, особенно o4-mini и недавно выпущенные версии с открытым исходным кодом gpt-oss, продемонстрировали исключительную эффективность токенов, особенно при решении математических задач. Исследование показало, что модели OpenAI «отличаются исключительной эффективностью токенов при решении математических задач», используя до трёх раз меньше токенов, чем другие коммерческие модели.

Среди вариантов с открытым исходным кодом llama-3.3-nemotron-super-49b-v1 от Nvidia оказалась «самой эффективной по токенам открытой весовой моделью во всех доменах», в то время как более новые модели от таких компаний, как Mistral, показали «исключительно высокое использование токенов» как выбросы.

Разница в эффективности значительно различалась в зависимости от типа задачи. В то время как открытые модели использовали примерно вдвое больше токенов для решения математических и логических задач, разница резко возрастала для простых вопросов на знания, где эффективное рассуждение не требовалось.

977f50abd169e3ec18430a1e9c3d5acf
Новейшие модели OpenAI обеспечивают самые низкие затраты на простые вопросы, в то время как некоторые альтернативы с открытым исходным кодом могут стоить значительно дороже, несмотря на более низкую цену за токен. (Источник: Nous Research)

Что нужно знать руководителям предприятий о расходах на вычисления с использованием ИИ

Результаты исследования имеют непосредственное значение для внедрения искусственного интеллекта в компаниях, где затраты на вычисления могут быстро расти по мере роста использования. Компании, оценивающие модели искусственного интеллекта, часто ориентируются на показатели точности и цены за токен, но могут упускать из виду общие вычислительные требования для реальных задач.

«Более высокая эффективность токенов закрытых весовых моделей часто компенсирует более высокую стоимость API этих моделей», — обнаружили исследователи при анализе общих затрат на вывод.

Исследование также показало, что поставщики моделей с закрытым исходным кодом, по всей видимости, активно оптимизируют свои решения для повышения эффективности. «Модели с закрытым исходным кодом были итеративно оптимизированы для использования меньшего количества токенов с целью снижения стоимости вывода», в то время как модели с открытым исходным кодом «увеличили использование токенов в новых версиях, что, возможно, отражает приоритет повышения эффективности рассуждений».

5b87f3fe5f13f3463f92d75efa477c32
Вычислительные затраты значительно различаются у разных поставщиков ИИ: некоторые модели используют более 1000 токенов для внутренних рассуждений при выполнении простых задач. (Источник: Nous Research)

Как исследователи взломали код измерения эффективности ИИ

Исследовательская группа столкнулась с уникальными проблемами при измерении эффективности различных архитектур моделей. Многие модели с закрытым исходным кодом не раскрывают исходные процессы рассуждений, предоставляя вместо этого сжатые сводки внутренних вычислений, чтобы предотвратить копирование их методов конкурентами.

Чтобы решить эту проблему, исследователи использовали токены завершения — общие вычислительные единицы, начисляемые за каждый запрос, — в качестве показателя трудозатрат на рассуждения. Они обнаружили, что «большинство современных моделей с закрытым исходным кодом не делятся своими исходными следами рассуждений», а вместо этого «используют более компактные языковые модели для транскрибирования цепочки мыслей в резюме или сжатые представления».

Методология исследования включала тестирование с использованием модифицированных версий известных задач, чтобы минимизировать влияние запомненных решений, таких как изменение переменных в задачах математического конкурса из Американского пригласительного экзамена по математике (AIME).

eb5143d832b95fd589e1dadd2dd48c8f
Различные модели ИИ демонстрируют разные соотношения между вычислениями и результатами: некоторые поставщики сжимают трассировки рассуждений, а другие предоставляют полную информацию. (Источник: Nous Research)

Будущее эффективности ИИ: что нас ждет дальше

Исследователи предлагают, чтобы эффективность токенов стала основной целью оптимизации наряду с точностью при разработке будущих моделей. «Более уплотнённый CoT также позволит эффективнее использовать контекст и может предотвратить его деградацию при выполнении сложных задач на рассуждение», — пишут они.

Выпуск моделей OpenAI gpt-oss с открытым исходным кодом, которые демонстрируют современную эффективность с «свободно доступными CoT», может послужить отправной точкой для оптимизации других моделей с открытым исходным кодом.

Полный набор данных исследования и код оценки доступны на GitHub, что позволяет другим исследователям проверить и расширить результаты. Поскольку индустрия ИИ стремится к более мощным возможностям рассуждения, это исследование показывает, что реальная конкуренция может заключаться не в том, кто создаст самый умный ИИ, а в том, кто создаст самый эффективный.

В конце концов, в мире, где каждый токен имеет значение, самые расточительные модели могут оказаться вытесненными с рынка, независимо от того, насколько хорошо они умеют мыслить.

Источник: venturebeat.com

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Компания Anthropic получила от Amazon 5 миллиардов долларов и в обмен пообещала инвестировать 100 миллиардов долларов в облачные сервисы.
dummy-img
Загрузка: обход банковских систем кибермошенниками и проблемы с удалением углерода.
Загрузка: обход банковских систем кибермошенниками и проблемы с удалением углерода.
dummy-img
dummy-img
Взаимодействие человека и машины погружается под воду.
Взаимодействие человека и машины погружается под воду.
Дифференциально приватное машинное обучение в масштабе с использованием JAX-Privacy
Image Not Found
Компания Anthropic получила от Amazon 5 миллиардов долларов и в обмен пообещала инвестировать 100 миллиардов долларов в облачные сервисы.

Компания Anthropic получила от Amazon 5 миллиардов долларов и в обмен пообещала инвестировать 100 миллиардов долларов в облачные сервисы.

Вкратце Опубликовано: Изображение предоставлено: Thos Robinson/Getty Images для The New York Times (откроется в новом окне) Джули Борт Компания Anthropic получила от Amazon 5 миллиардов долларов и в обмен пообещала инвестировать 100 миллиардов долларов в облачные сервисы.…

Апр 21, 2026
dummy-img

Как почистить виниловые пластинки (2026): пылесос, ультразвук, чистящий раствор, щетка.

Эти щелчки и треск недопустимы. Приведите свою музыку в порядок с помощью этого удобного руководства. Источник: www.wired.com

Апр 21, 2026
Загрузка: обход банковских систем кибермошенниками и проблемы с удалением углерода.

Загрузка: обход банковских систем кибермошенниками и проблемы с удалением углерода.

Это сегодняшний выпуск The Download, нашей ежедневной новостной рассылки, которая предоставляет вам ежедневную порцию событий в мире технологий. Кибермошенники обходят системы безопасности банков с помощью незаконных инструментов, продаваемых в Telegram. В центре по отмыванию денег в Камбодже…

Апр 21, 2026
Загрузка: обход банковских систем кибермошенниками и проблемы с удалением углерода.

Загрузка: обход банковских систем кибермошенниками и проблемы с удалением углерода.

Это сегодняшний выпуск The Download, нашей ежедневной новостной рассылки, которая предоставляет вам ежедневную порцию событий в мире технологий. Кибермошенники обходят системы безопасности банков с помощью незаконных инструментов, продаваемых в Telegram. В центре по отмыванию денег в Камбодже…

Апр 21, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых