Собственная разработка Alibaba — аккумулятор Qwen3.7-Max — может работать автономно до 35 часов и поддерживает внешние кабельные вводы, такие как Claude Code от Anthropic.
Карл Франзен
Опубликовано
Обновлено

Индустрия искусственного интеллекта полностью вступила в «эпоху агентов» — парадигму, в которой модели ИИ делают гораздо больше, чем просто генерируют текст: теперь они активно планируют, выполняют и корректируют сложные задачи в течение нескольких дней, а не секунд.
Поэтому, пожалуй, неудивительно, что знаменитая команда исследователей ИИ Qwen, возглавляемая китайским гигантом электронной коммерции Alibaba, выпустила модель, способную выполнять автономную работу в режиме искусственного интеллекта в течение нескольких дней: эта модель представлена в виде Qwen3.7-Max, которая, как сообщается в блоге компании, достигла «~35 часов непрерывного автономного выполнения» — хотя и в проприетарном, а не открытом формате, в отличие от предыдущих релизов команды Qwen.
Это тоже вполне ожидаемо — именно этого опасались многие аналитики и отраслевые эксперты после ухода нескольких ключевых руководителей команды Qwen в начале этого года. Но для Alibaba это имеет финансовый смысл, по крайней мере, в краткосрочной перспективе: обучение моделей ИИ, особенно таких мощных, как Qwen3.7-Max, обходится дорого, и предоставление их практически бесплатно, как это бывает с моделями с открытым исходным кодом, не помогает немедленно окупить затраты.
В этом смысле Alibaba просто координирует свои усилия с американскими гигантами в области искусственного интеллекта, такими как OpenAI и Google, предлагая самые новые и лучшие модели только через платные API и подписки или платные пакеты веб-планов, а менее производительные — через открытый исходный код.
Тем не менее, появление Qwen3.7-Max предоставляет предприятиям и индивидуальным пользователям дополнительные возможности выбора, а также усиливает конкуренцию для американских лабораторий искусственного интеллекта — что редко бывает плохо для потребителей любого бюджета. Однако тот факт, что эта модель доступна только с китайских устройств, означает, что ее привлекательность для американских и европейских предприятий, стремящихся максимально обеспечить соответствие требованиям и безопасность при выполнении государственных контрактов или даже просто пытающихся соблюдать все соответствующие государственные, местные и национальные правила в отношении суверенитета данных, может быть ограничена.
Эпоха марафонского искусственного интеллекта
Чтобы понять, почему Qwen3.7-Max отличается от предыдущих моделей, необходимо рассмотреть, как она обучалась и как работает на практике.
Языковые модели обычно деградируют, когда им приходится поддерживать единую цепочку мыслей на протяжении тысяч диалогов; они забывают инструкции, создают галлюцинации переменных или просто застревают в логических циклах. Qwen3.7-Max был специально разработан как «универсальная агентная база», способная к «рассуждениям в долгосрочной перспективе», чтобы преодолеть именно это узкое место.
Наиболее наглядным примером этой возможности является автономная инженерная задача, подробно описанная командой Qwen. Модели был предоставлен доступ к изолированному серверу, оснащенному процессором T-Head ZW-M890 PPU — аппаратной архитектурой, с которой модель никогда не сталкивалась во время обучения. Ее задача заключалась в оптимизации ядра механизма внимания.
В течение 35 часов подряд Qwen3.7-Max работал полностью автономно. Он выполнил 1158 различных вызовов инструментов, провел 432 вычисления ядра, диагностировал ошибки компиляции и итеративно улучшал код, достигнув 10-кратного геометрического ускорения.
Для сравнения, китайские конкуренты, такие как z.ai GLM-5.1 и Moonshot Kimi K2.6, показали максимальное ускорение в 7,3 и 5 раз соответственно, часто добровольно прерывая сеансы при отсутствии прогресса. Однако обе программы доступны с открытым исходным кодом.
Такая устойчивость достигается за счет того, что Alibaba называет «масштабированием среды». Подобно тому, как ранние модели LLM становились умнее, обрабатывая более разнообразный текст, Qwen3.7-Max обучалась в обширной, масштабированной среде динамических агентов.
Модель способна имитировать годовой жизненный цикл стартапа в рамках оценки «YC-Bench», проходя сотни этапов принятия решений, включая управление персоналом и отбор кандидатов на контракты. В ходе этой симуляции модель смогла сгенерировать виртуальный доход в размере 2,08 миллиона долларов, что почти вдвое превышает показатели предыдущего поколения, Qwen3.6-Plus.
Кроме того, модель имеет встроенную систему самоконтроля, позволяющую автоматически обнаруживать попытки обмана обучающей среды и добавлять эвристические правила для корректировки собственного поведения.
Мозг для любых строительных лесов
С точки зрения продукта, Qwen3.7-Max разработан как когнитивный движок для современной разработки программного обеспечения и автоматизации предприятий.
Данная модель предлагает огромное контекстное окно в 1 миллион токенов и максимальный лимит выходных данных в 64 000, что создает значительные накладные расходы при обработке обширных кодовых баз или длинных технических документов.
Одна из его наиболее привлекательных особенностей — «универсальная совместимость». Вместо того чтобы быть жестко запрограммированным для оптимальной работы в рамках конкретного проприетарного интерфейса, Qwen3.7-Max создан как готовый к использованию слой интеллекта для различных агентских фреймворков. Он поддерживает протокол Anthropic API нативно, что позволяет разработчикам напрямую интегрировать его в существующие инструменты, такие как Claude Code или OpenClaw.
Данные, предоставленные Alibaba, свидетельствуют о том, что этот обобщенный подход принес огромные дивиденды.
В бенчмарке Apex Math Reasoning Qwen3.7-Max набрал 44,5 балла, превзойдя результат Claude Opus-4.6 Max (34,5 балла) и DeepSeek V4-Pro Max (38,3 балла). Он также показал превосходные результаты в Humanity's Last Exam (41,4 балла) и реалистичном бенчмарке для программистов MCP-Atlas (76,4 балла).

Это приносит ощутимую пользу конечным пользователям. Благодаря интеграции с протоколом контекста модели (MCP) с открытым исходным кодом, модель может работать как автономный офисный помощник, способный считывать университетские спецификации форматирования и автоматически переформатировать неряшливый документ Word с помощью инструментов командной строки без вмешательства человека.
Поддержание такого уровня интеллекта сопряжено с определенными затратами. Разработчики, обращающиеся к API через Alibaba Cloud Model Studio, будут платить 2,50 доллара за 1 миллион входных токенов и 7,50 доллара за 1 миллион выходных токенов. Платформа также предусматривает явное ценообразование при создании кэша и чтении, а также комиссию в размере 10 долларов за 1000 вызовов для интегрированного веб-поиска, хотя инструменты интерпретатора кода остаются бесплатными в течение ограниченного времени.
Qwen3.7-Max занимает стратегически важное промежуточное положение в современной экономике API. Хотя он и стоит значительно дороже, чем конкуренты на внутреннем рынке, предлагающие агрессивные цены — почти вдвое дороже DeepSeek V4 Pro (5,22 доллара) и Z.ai GLM-5.1 (5,80 доллара) — он значительно уступает западным гигантам, с которыми регулярно сравнивается в бенчмарках.
Для сравнения, запуск ресурсоемких рабочих процессов с использованием GPT-5.4 от OpenAI или Claude Opus 4.7 от Anthropic обойдется разработчикам в 17,50 и 30,00 долларов за миллион токенов соответственно. См. таблицу цен VentureBeat ниже:
Сводка цен на API для моделей искусственного интеллекта VentureBeat Frontier.
|
Модель |
Вход |
Выход |
Общая стоимость |
Источник |
|
MiMo-V2.5 Flash |
0,10 доллара |
0,30 доллара |
0,40 доллара |
Сяоми МиМо |
|
Минимакс М2.7 |
0,30 доллара |
1,20 доллара |
1,50 доллара |
МиниМакс |
|
Фонарик Gemini 3.1 |
0,25 доллара |
1,50 доллара |
1,75 доллара |
|
|
MiMo-V2.5 |
0,40 доллара |
2,00 доллара |
2,40 доллара |
Сяоми МиМо |
|
Кими-К2.6 |
0,95 доллара |
4,00 доллара |
4,95 доллара |
Муншот/Кими |
|
ГЛМ-5 |
1,00 долл. |
3,20 доллара |
4,20 доллара |
З.ай |
|
Grok 4.3 (низкий контекст) |
1,25 доллара |
2,50 доллара |
3,75 доллара |
xAI |
|
DeepSeek V4 Pro |
1,74 доллара |
3,48 доллара |
5,22 доллара |
DeepSeek |
|
GLM-5.1 |
1,40 доллара |
4,40 доллара |
5,80 долларов |
З.ай |
|
Клод Хайку 4.5 |
1,00 долл. |
5,00 долларов |
6,00 долларов |
Антропический |
|
Grok 4.3 (высококонтекстный) |
2,50 доллара |
5,00 долларов |
7,50 долларов |
xAI |
|
Qwen3.7-Max |
2,50 доллара |
7,50 долларов |
10,00 долларов |
Alibaba Cloud |
|
Вспышка Gemini 3.5 |
1,50 доллара |
9,00 долларов |
10,50 долларов |
|
|
Gemini 3.1 Pro Preview (≤200K) |
2,00 доллара |
12,00 долларов |
14,00 долларов |
|
|
ГПТ-5.4 |
2,50 доллара |
15,00 долларов |
17,50 долларов |
OpenAI |
|
Gemini 3.1 Pro Preview (>200K) |
4,00 доллара |
18,00 долларов |
22,00 долларов |
|
|
Клод Опус 4.7 |
5,00 долларов |
25,00 долларов |
30,00 долларов |
Антропический |
|
ГПТ-5.5 |
5,00 долларов |
30,00 долларов |
35,00 долларов |
OpenAI |
Разместив Qwen3.7-Max чуть ниже Google Gemini 3.5 Flash (10,50 долларов), но значительно выше бюджетных моделей, Alibaba сигнализирует, что это не просто товар массового производства; это флагманский процессор логических вычислений, цена которого призвана переманить корпоративные задачи у самых дорогих предложений Кремниевой долины.
Лицензирование пока остается конфиденциальной информацией.
Несмотря на все свои технические достоинства, наиболее спорным аспектом Qwen3.7-Max является способ его распространения. Qwen позиционирует этот релиз как «проприетарную модель». Он работает исключительно через API.
Исторически сложилось так, что Qwen от Alibaba был героем для сообществ разработчиков открытого исходного кода и местных сообществ LLM. Предыдущие версии, такие как Qwen 2.5 и Qwen 3.6, публиковали свои веса. Открытые веса позволяют разработчикам, исследователям и предприятиям загружать модель, запускать ее на собственном оборудовании и точно настраивать для узкоспециализированных или чувствительных к данным сценариев использования, не отправляя конфиденциальную информацию на сторонний сервер.
Заблокировав доступ к Qwen3.7-Max через API, Alibaba переходит к стандартной коммерческой стратегии, используемой OpenAI (с GPT-4) и Anthropic (с Claude). Для корпоративных пользователей это означает, что использование Qwen3.7-Max требует доверия Alibaba Cloud к своим потокам данных и полной зависимости от интернет-соединения для запуска рабочих процессов агентов. Для сообщества открытого исходного кода это означает потерю доступа к одной из самых мощных моделей в мире.
Реакция общества разделилась на восхищение и разочарование.
Реакция со стороны сообщества разработчиков последовала незамедлительно и характеризовалась сочетанием глубокого уважения к инженерным достижениям и разочарования по поводу модели лицензирования.
Известный комментатор в области ИИ Судо Су (@sudoingX) выразил преобладающее мнение на X (ранее Twitter). «qwen — это нечто невероятное», — написал он. «Они только что выпустили 3.7 max, и он превосходит opus 4.6 max по большинству проведенных тестов».
Технические показатели, особенно выносливость модели, поразили многих специалистов в этой области. «Результат Apex Math, 44,5 против 34,5 у Opus, — это немаленькая разница», — отметил Судо Су. «35 часов непрерывной работы над задачей оптимизации ядра с более чем 1000 вызовами инструментов — это то, что я постоянно перечитываю. Это действительно показывает, что эра агентов работает, а не просто сходит на нет».
Скорость внедрения решений Alibaba также привлекает внимание. После выпуска Qwen 3.6 всего месяц назад, переход к 3.7-Max подчеркивает неустанный темп разработки. Как заметил Судо Су, «никто больше так не развивается».
Однако, несмотря на похвалу, переход к закрытой экосистеме сопряжен с серьезными оговорками. Потеря весовых коэффициентов модели рассматривается как удар по локализованному движению в области ИИ, которое опирается на передовые открытые модели для расширения границ возможностей потребительского оборудования или частных корпоративных кластеров.
«Однако, пожалуйста, сделайте и этот проект открытым исходным кодом», — умолял Судо Су в своем посте. «Версия Dense 3.6 улучшила всю локальную экосистему LLM. Переход Max-Tier только на API закроет дверь, которую мы до сих пор оставляли открытой. В конце концов, предоставьте нам веса».
Qwen3.7-Max доказывает, что эра автономных агентов больше не является теоретической проекцией; это реальность, способная выполнять сложные инженерные задачи, пока люди спят. Единственный вопрос теперь заключается в том, станет ли этот новый рубеж ИИ доступным ресурсом, который можно загрузить на ноутбук, или же интеллектуальным инструментом, арендуемым исключительно в облаке. На данный момент, с Qwen3.7-Max, это, несомненно, последнее.
Подпишитесь, чтобы получать самые свежие новости!
Подробные аналитические данные для руководителей предприятий в области искусственного интеллекта, данных и безопасности.
Отправляя свой адрес электронной почты, вы соглашаетесь с нашими Условиями использования и Политикой конфиденциальности.
Получайте обновления ! Вы подписаны! Наши последние новости скоро поступят на вашу электронную почту.
Источник: venturebeat.com

Добавить комментарий
Для отправки комментария вам необходимо авторизоваться.