Image

Эта «дешевая» модель ИИ с открытым исходным кодом на самом деле сжигает ваш вычислительный бюджет

Источник: VentureBeat, создано с помощью Midjourney Источник: VentureBeat, создано с помощью Midjourney

Хотите получать более ценную информацию? Подпишитесь на наши еженедельные рассылки, чтобы получать только то, что важно для руководителей в сфере корпоративного ИИ, данных и безопасности. Подпишитесь сейчас

Новое комплексное исследование показало, что модели искусственного интеллекта с открытым исходным кодом потребляют значительно больше вычислительных ресурсов, чем их конкуренты с закрытым исходным кодом при выполнении идентичных задач, что потенциально подрывает их ценовые преимущества и меняет подход предприятий к оценке стратегий развертывания ИИ.

Исследование, проведённое компанией Nous Research, специализирующейся на искусственном интеллекте, показало, что модели с открытыми весами используют в 1,5–4 раза больше токенов — базовых единиц вычислений ИИ — чем закрытые модели, такие как OpenAI и Anthropic. В случае простых вопросов на знания разрыв значительно увеличивался: некоторые открытые модели использовали до 10 раз больше токенов.

«Открытые модели веса используют в 1,5–4 раза больше токенов, чем закрытые (до 10 раз для простых вопросов на знания), что иногда делает их более дорогими в расчете на запрос, несмотря на более низкие затраты на токен», — написали исследователи в своем отчете, опубликованном в среду.

Результаты исследования ставят под сомнение устоявшееся в индустрии ИИ предположение о том, что модели с открытым исходным кодом обладают явными экономическими преимуществами по сравнению с проприетарными аналогами. Хотя запуск моделей с открытым исходным кодом обычно обходится дешевле в расчёте на токен, исследование предполагает, что это преимущество может быть «легко нивелировано, если для решения конкретной задачи требуется больше токенов».

Масштабирование ИИ достигает предела

Ограничения мощности, рост стоимости токенов и задержки в выводе данных меняют корпоративный ИИ. Присоединяйтесь к нашему эксклюзивному салону, чтобы узнать, как обстоят дела у лучших команд:

  • Превращение энергии в стратегическое преимущество
  • Разработка эффективного вывода для реального увеличения пропускной способности
  • Обеспечение конкурентоспособной рентабельности инвестиций с помощью устойчивых систем ИИ

Забронируйте свое место, чтобы оставаться впереди : https://bit.ly/4mwGngO

Реальная стоимость ИИ: почему «более дешевые» модели могут разорить ваш бюджет

В исследовании были рассмотрены 19 различных моделей ИИ для трёх категорий задач: вопросы на базовые знания, математические задачи и логические головоломки. Команда измеряла «эффективность токенов» — количество вычислительных единиц, используемых моделями, по отношению к сложности их решений. Эта метрика мало изучена систематически, несмотря на её значительные финансовые последствия.

«Эффективность токенов — критически важный показатель по нескольким практическим причинам», — отметили исследователи. «Хотя хостинг открытых весовых моделей может быть дешевле, это преимущество в стоимости может быть легко нивелировано, если для решения конкретной задачи потребуется больше токенов».

88e7bfea6d571309f0204eabb9826fb4
Модели ИИ с открытым исходным кодом используют до 12 раз больше вычислительных ресурсов, чем самые эффективные закрытые модели для решения базовых вопросов знаний. (Источник: Nous Research)

Эта неэффективность особенно ярко проявляется в случае больших моделей рассуждений (LRM), которые используют развёрнутые «цепочки мыслей» для решения сложных задач. Эти модели, предназначенные для пошагового решения задач, могут потреблять тысячи токенов для решения простых вопросов, требующих минимального объёма вычислений.

Исследование показало, что для базовых вопросов на знания, таких как «Какая столица Австралии?», модели рассуждения тратят «сотни токенов на обдумывание простых вопросов на знания», на которые можно ответить одним словом.

Какие модели ИИ действительно дают максимальную отдачу от ваших вложений

Исследование выявило существенные различия между поставщиками моделей. Модели OpenAI, особенно o4-mini и недавно выпущенные версии с открытым исходным кодом gpt-oss, продемонстрировали исключительную эффективность токенов, особенно при решении математических задач. Исследование показало, что модели OpenAI «отличаются исключительной эффективностью токенов при решении математических задач», используя до трёх раз меньше токенов, чем другие коммерческие модели.

Среди вариантов с открытым исходным кодом llama-3.3-nemotron-super-49b-v1 от Nvidia оказалась «самой эффективной по токенам открытой весовой моделью во всех доменах», в то время как более новые модели от таких компаний, как Mistral, показали «исключительно высокое использование токенов» как выбросы.

Разница в эффективности значительно различалась в зависимости от типа задачи. В то время как открытые модели использовали примерно вдвое больше токенов для решения математических и логических задач, разница резко возрастала для простых вопросов на знания, где эффективное рассуждение не требовалось.

977f50abd169e3ec18430a1e9c3d5acf
Новейшие модели OpenAI обеспечивают самые низкие затраты на простые вопросы, в то время как некоторые альтернативы с открытым исходным кодом могут стоить значительно дороже, несмотря на более низкую цену за токен. (Источник: Nous Research)

Что нужно знать руководителям предприятий о расходах на вычисления с использованием ИИ

Результаты исследования имеют непосредственное значение для внедрения искусственного интеллекта в компаниях, где затраты на вычисления могут быстро расти по мере роста использования. Компании, оценивающие модели искусственного интеллекта, часто ориентируются на показатели точности и цены за токен, но могут упускать из виду общие вычислительные требования для реальных задач.

«Более высокая эффективность токенов закрытых весовых моделей часто компенсирует более высокую стоимость API этих моделей», — обнаружили исследователи при анализе общих затрат на вывод.

Исследование также показало, что поставщики моделей с закрытым исходным кодом, по всей видимости, активно оптимизируют свои решения для повышения эффективности. «Модели с закрытым исходным кодом были итеративно оптимизированы для использования меньшего количества токенов с целью снижения стоимости вывода», в то время как модели с открытым исходным кодом «увеличили использование токенов в новых версиях, что, возможно, отражает приоритет повышения эффективности рассуждений».

5b87f3fe5f13f3463f92d75efa477c32
Вычислительные затраты значительно различаются у разных поставщиков ИИ: некоторые модели используют более 1000 токенов для внутренних рассуждений при выполнении простых задач. (Источник: Nous Research)

Как исследователи взломали код измерения эффективности ИИ

Исследовательская группа столкнулась с уникальными проблемами при измерении эффективности различных архитектур моделей. Многие модели с закрытым исходным кодом не раскрывают исходные процессы рассуждений, предоставляя вместо этого сжатые сводки внутренних вычислений, чтобы предотвратить копирование их методов конкурентами.

Чтобы решить эту проблему, исследователи использовали токены завершения — общие вычислительные единицы, начисляемые за каждый запрос, — в качестве показателя трудозатрат на рассуждения. Они обнаружили, что «большинство современных моделей с закрытым исходным кодом не делятся своими исходными следами рассуждений», а вместо этого «используют более компактные языковые модели для транскрибирования цепочки мыслей в резюме или сжатые представления».

Методология исследования включала тестирование с использованием модифицированных версий известных задач, чтобы минимизировать влияние запомненных решений, таких как изменение переменных в задачах математического конкурса из Американского пригласительного экзамена по математике (AIME).

eb5143d832b95fd589e1dadd2dd48c8f
Различные модели ИИ демонстрируют разные соотношения между вычислениями и результатами: некоторые поставщики сжимают трассировки рассуждений, а другие предоставляют полную информацию. (Источник: Nous Research)

Будущее эффективности ИИ: что нас ждет дальше

Исследователи предлагают, чтобы эффективность токенов стала основной целью оптимизации наряду с точностью при разработке будущих моделей. «Более уплотнённый CoT также позволит эффективнее использовать контекст и может предотвратить его деградацию при выполнении сложных задач на рассуждение», — пишут они.

Выпуск моделей OpenAI gpt-oss с открытым исходным кодом, которые демонстрируют современную эффективность с «свободно доступными CoT», может послужить отправной точкой для оптимизации других моделей с открытым исходным кодом.

Полный набор данных исследования и код оценки доступны на GitHub, что позволяет другим исследователям проверить и расширить результаты. Поскольку индустрия ИИ стремится к более мощным возможностям рассуждения, это исследование показывает, что реальная конкуренция может заключаться не в том, кто создаст самый умный ИИ, а в том, кто создаст самый эффективный.

В конце концов, в мире, где каждый токен имеет значение, самые расточительные модели могут оказаться вытесненными с рынка, независимо от того, насколько хорошо они умеют мыслить.

Источник: venturebeat.com

✅ Найденные теги: новости, Эта
Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Фото сгенерированных лиц: исследование показывает, что люди не могут отличить настоящие лица от сгенерированных
Нейросети построили капитализм за трое суток: 100 агентов Claude заперли…
Скетч: цифровой осьминог и виртуальный мир внутри компьютера с человечком.
Сцена с жестами пальцами, где один жест символизирует "VPN", а другой "KHP".
‼️Paramount купила Warner Bros. Discovery — сумма сделки составила безумные…
Скриншот репозитория GitHub "Claude Scientific Skills" AI для научных исследований.
Структура эффективного запроса Claude с элементами задачи, контекста и референса.
Эскиз и готовая веб-страница платформы для AI-дизайна в современном темном режиме.
ideipro logotyp
Image Not Found
Звёздное небо с галактиками и туманностями, космос, Вселенная, астрофотография.

Система оповещения обсерватории Рубина отправила 800 000 сигналов в первую ночь наблюдений.

Астрономы будут получать оповещения о небесных явлениях в течение нескольких минут после их обнаружения. Теренс О'Брайен, редактор раздела «Выходные». Публикации этого автора будут добавляться в вашу ежедневную рассылку по электронной почте и в ленту новостей на главной…

Мар 2, 2026
Женщина с длинными тёмными волосами в синем свете, нейтральный фон.

Расследование в отношении 61-фунтовой машины, которая «пожирает» пластик и выплевывает кирпичи.

Обзор компактного пресса для мягкого пластика Clear Drop — и что будет дальше. Шон Холлистер, старший редактор Публикации этого автора будут добавляться в вашу ежедневную рассылку по электронной почте и в ленту новостей на главной странице вашего…

Мар 2, 2026
Черный углеродное волокно с текстурой плетения, отражающий свет.

Материал будущего: как работает «бессмертный» композит

Учёные из Университета штата Северная Каролина представили композит нового поколения, способный самостоятельно восстанавливаться после серьёзных повреждений.  Речь идёт о модифицированном армированном волокном полимере (FRP), который не просто сохраняет прочность при малом весе, но и способен «залечивать» внутренние…

Мар 2, 2026
Круглый экран с изображением замка и горы, рядом электронная плата.

Круглый дисплей Waveshare для креативных проектов

Круглый 7-дюймовый сенсорный дисплей от Waveshare создан для разработчиков и дизайнеров, которым нужен нестандартный экран.  Это IPS-панель с разрешением 1 080×1 080 пикселей, поддержкой 10-точечного ёмкостного сенсора, оптической склейкой и защитным закалённым стеклом, выполненная в круглом форм-факторе.…

Мар 2, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых