Эта «дешевая» модель ИИ с открытым исходным кодом на самом деле сжигает ваш вычислительный бюджет

29.08.2025 ideipro.ru

Источник: VentureBeat, создано с помощью Midjourney

Хотите получать более ценную информацию? Подпишитесь на наши еженедельные рассылки, чтобы получать только то, что важно для руководителей в сфере корпоративного ИИ, данных и безопасности. Подпишитесь сейчас

Новое комплексное исследование показало, что модели искусственного интеллекта с открытым исходным кодом потребляют значительно больше вычислительных ресурсов, чем их конкуренты с закрытым исходным кодом при выполнении идентичных задач, что потенциально подрывает их ценовые преимущества и меняет подход предприятий к оценке стратегий развертывания ИИ.

Исследование, проведённое компанией Nous Research, специализирующейся на искусственном интеллекте, показало, что модели с открытыми весами используют в 1,5–4 раза больше токенов — базовых единиц вычислений ИИ — чем закрытые модели, такие как OpenAI и Anthropic. В случае простых вопросов на знания разрыв значительно увеличивался: некоторые открытые модели использовали до 10 раз больше токенов.

Измерение эффективности мышления в моделях рассуждений: недостающий эталонhttps://t.co/b1e1rJx6vZ

Мы измерили использование токенов в разных моделях рассуждений: открытые модели выдают в 1,5–4 раза больше токенов, чем закрытые модели, при выполнении одинаковых задач, но с огромным разбросом в зависимости от типа задачи (до… pic.twitter.com/LY1083won8

— Nous Research (@NousResearch) 14 августа 2025 г.

«Открытые модели веса используют в 1,5–4 раза больше токенов, чем закрытые (до 10 раз для простых вопросов на знания), что иногда делает их более дорогими в расчете на запрос, несмотря на более низкие затраты на токен», — написали исследователи в своем отчете, опубликованном в среду.

Результаты исследования ставят под сомнение устоявшееся в индустрии ИИ предположение о том, что модели с открытым исходным кодом обладают явными экономическими преимуществами по сравнению с проприетарными аналогами. Хотя запуск моделей с открытым исходным кодом обычно обходится дешевле в расчёте на токен, исследование предполагает, что это преимущество может быть «легко нивелировано, если для решения конкретной задачи требуется больше токенов».

Масштабирование ИИ достигает предела

Ограничения мощности, рост стоимости токенов и задержки в выводе данных меняют корпоративный ИИ. Присоединяйтесь к нашему эксклюзивному салону, чтобы узнать, как обстоят дела у лучших команд:

Превращение энергии в стратегическое преимущество
Разработка эффективного вывода для реального увеличения пропускной способности
Обеспечение конкурентоспособной рентабельности инвестиций с помощью устойчивых систем ИИ

Забронируйте свое место, чтобы оставаться впереди : https://bit.ly/4mwGngO

Реальная стоимость ИИ: почему «более дешевые» модели могут разорить ваш бюджет

В исследовании были рассмотрены 19 различных моделей ИИ для трёх категорий задач: вопросы на базовые знания, математические задачи и логические головоломки. Команда измеряла «эффективность токенов» — количество вычислительных единиц, используемых моделями, по отношению к сложности их решений. Эта метрика мало изучена систематически, несмотря на её значительные финансовые последствия.

«Эффективность токенов — критически важный показатель по нескольким практическим причинам», — отметили исследователи. «Хотя хостинг открытых весовых моделей может быть дешевле, это преимущество в стоимости может быть легко нивелировано, если для решения конкретной задачи потребуется больше токенов».

Модели ИИ с открытым исходным кодом используют до 12 раз больше вычислительных ресурсов, чем самые эффективные закрытые модели для решения базовых вопросов знаний. (Источник: Nous Research)

Эта неэффективность особенно ярко проявляется в случае больших моделей рассуждений (LRM), которые используют развёрнутые «цепочки мыслей» для решения сложных задач. Эти модели, предназначенные для пошагового решения задач, могут потреблять тысячи токенов для решения простых вопросов, требующих минимального объёма вычислений.

Исследование показало, что для базовых вопросов на знания, таких как «Какая столица Австралии?», модели рассуждения тратят «сотни токенов на обдумывание простых вопросов на знания», на которые можно ответить одним словом.

Какие модели ИИ действительно дают максимальную отдачу от ваших вложений

Исследование выявило существенные различия между поставщиками моделей. Модели OpenAI, особенно o4-mini и недавно выпущенные версии с открытым исходным кодом gpt-oss, продемонстрировали исключительную эффективность токенов, особенно при решении математических задач. Исследование показало, что модели OpenAI «отличаются исключительной эффективностью токенов при решении математических задач», используя до трёх раз меньше токенов, чем другие коммерческие модели.

Среди вариантов с открытым исходным кодом llama-3.3-nemotron-super-49b-v1 от Nvidia оказалась «самой эффективной по токенам открытой весовой моделью во всех доменах», в то время как более новые модели от таких компаний, как Mistral, показали «исключительно высокое использование токенов» как выбросы.

Разница в эффективности значительно различалась в зависимости от типа задачи. В то время как открытые модели использовали примерно вдвое больше токенов для решения математических и логических задач, разница резко возрастала для простых вопросов на знания, где эффективное рассуждение не требовалось.

Новейшие модели OpenAI обеспечивают самые низкие затраты на простые вопросы, в то время как некоторые альтернативы с открытым исходным кодом могут стоить значительно дороже, несмотря на более низкую цену за токен. (Источник: Nous Research)

Что нужно знать руководителям предприятий о расходах на вычисления с использованием ИИ

Результаты исследования имеют непосредственное значение для внедрения искусственного интеллекта в компаниях, где затраты на вычисления могут быстро расти по мере роста использования. Компании, оценивающие модели искусственного интеллекта, часто ориентируются на показатели точности и цены за токен, но могут упускать из виду общие вычислительные требования для реальных задач.

«Более высокая эффективность токенов закрытых весовых моделей часто компенсирует более высокую стоимость API этих моделей», — обнаружили исследователи при анализе общих затрат на вывод.

Исследование также показало, что поставщики моделей с закрытым исходным кодом, по всей видимости, активно оптимизируют свои решения для повышения эффективности. «Модели с закрытым исходным кодом были итеративно оптимизированы для использования меньшего количества токенов с целью снижения стоимости вывода», в то время как модели с открытым исходным кодом «увеличили использование токенов в новых версиях, что, возможно, отражает приоритет повышения эффективности рассуждений».

Вычислительные затраты значительно различаются у разных поставщиков ИИ: некоторые модели используют более 1000 токенов для внутренних рассуждений при выполнении простых задач. (Источник: Nous Research)

Как исследователи взломали код измерения эффективности ИИ

Исследовательская группа столкнулась с уникальными проблемами при измерении эффективности различных архитектур моделей. Многие модели с закрытым исходным кодом не раскрывают исходные процессы рассуждений, предоставляя вместо этого сжатые сводки внутренних вычислений, чтобы предотвратить копирование их методов конкурентами.

Чтобы решить эту проблему, исследователи использовали токены завершения — общие вычислительные единицы, начисляемые за каждый запрос, — в качестве показателя трудозатрат на рассуждения. Они обнаружили, что «большинство современных моделей с закрытым исходным кодом не делятся своими исходными следами рассуждений», а вместо этого «используют более компактные языковые модели для транскрибирования цепочки мыслей в резюме или сжатые представления».

Методология исследования включала тестирование с использованием модифицированных версий известных задач, чтобы минимизировать влияние запомненных решений, таких как изменение переменных в задачах математического конкурса из Американского пригласительного экзамена по математике (AIME).

Различные модели ИИ демонстрируют разные соотношения между вычислениями и результатами: некоторые поставщики сжимают трассировки рассуждений, а другие предоставляют полную информацию. (Источник: Nous Research)

Будущее эффективности ИИ: что нас ждет дальше

Исследователи предлагают, чтобы эффективность токенов стала основной целью оптимизации наряду с точностью при разработке будущих моделей. «Более уплотнённый CoT также позволит эффективнее использовать контекст и может предотвратить его деградацию при выполнении сложных задач на рассуждение», — пишут они.

Выпуск моделей OpenAI gpt-oss с открытым исходным кодом, которые демонстрируют современную эффективность с «свободно доступными CoT», может послужить отправной точкой для оптимизации других моделей с открытым исходным кодом.

Полный набор данных исследования и код оценки доступны на GitHub, что позволяет другим исследователям проверить и расширить результаты. Поскольку индустрия ИИ стремится к более мощным возможностям рассуждения, это исследование показывает, что реальная конкуренция может заключаться не в том, кто создаст самый умный ИИ, а в том, кто создаст самый эффективный.

В конце концов, в мире, где каждый токен имеет значение, самые расточительные модели могут оказаться вытесненными с рынка, независимо от того, насколько хорошо они умеют мыслить.

Источник: venturebeat.com

Оцените материал:

Эта «дешевая» модель ИИ с открытым исходным кодом на самом деле сжигает ваш вычислительный бюджет

Реальная стоимость ИИ: почему «более дешевые» модели могут разорить ваш бюджет

Какие модели ИИ действительно дают максимальную отдачу от ваших вложений

Что нужно знать руководителям предприятий о расходах на вычисления с использованием ИИ

Как исследователи взломали код измерения эффективности ИИ

Будущее эффективности ИИ: что нас ждет дальше

🤖 Нельсон AI

Гайды, руководства и полезные статьи

Реальная стоимость ИИ: почему «более дешевые» модели могут разорить ваш бюджет

Какие модели ИИ действительно дают максимальную отдачу от ваших вложений

Что нужно знать руководителям предприятий о расходах на вычисления с использованием ИИ

Как исследователи взломали код измерения эффективности ИИ

Будущее эффективности ИИ: что нас ждет дальше

Похожие записи

Похожие записи

Как внутренний аудит способствует прозрачности финансовых операций в организациях? Мнение Валерия Павловича Горегляда

Adobe интегрирует рабочие процессы с использованием искусственного интеллекта в Creative Cloud, переходя от создания медиаконтента к управлению процессом производства.

Первая видеокарта Radeon RX 9070 XT от SAPPHIRE пострадала от плавления 12V-2×6

Присоединяйтесь и подпишитесь на рассылку самых свежих новостей по Email

🤖 Нельсон AI