Платформа Qwen3.7-Plus от Alibaba поддерживает ввод текста, видео и изображений по низкой цене 0,4/1,6 доллара США за 1 миллион токенов — но она является собственной разработкой.
Карл Франзен

На этой неделе Alibaba выпустила Qwen3.7-Plus, новейшую модель обработки больших языков (LLM) на основе искусственного интеллекта в своем популярном и постоянно расширяющемся семействе Qwen, которая может похвастаться расширенными возможностями мультимодальной обработки и на 60% меньшей стоимостью, чем предыдущая модель Qwen3.7-Max, предназначенная только для работы с текстом и выпущенная всего несколько недель назад.
Однако, как и его непосредственный предшественник, Qwen3.7-Plus доступен только по «закрытой» коммерческой лицензии через собственные интерфейсы прикладного программирования (API) и Qwen Chat.
Это знаменует собой серьезный отход от стратегии Qwen, которая до сих пор была сосредоточена в основном на выпуске мощных, почти передовых моделей с открытым исходным кодом. Предприятия и пользователи, которые полагались на модели Qwen с открытым исходным кодом — среди них такие американские гиганты, как Airbnb — несомненно, будут разочарованы, узнав, что Alibaba закрывает доступ к своим новым продуктам.
Тем не менее, эта модель заслуживает внимания из-за своей низкой стоимости и высокой производительности в многомодальных задачах, таких как создание визуализаций корпоративного уровня или анализ видео, изображений и скриншотов, чего не может сделать Qwen3.7-Max (он работает только с текстом). Это одна из самых дешевых и мощных моделей с искусственным интеллектом, доступных сейчас, и по цене она немного выше, чем новый китайский конкурент MiniMax-M3, который сейчас продается со скидкой в течение ограниченного времени.
Сводка цен на API для моделей искусственного интеллекта VentureBeat Frontier.
|
Модель |
Вход |
Выход |
Общая стоимость |
Источник |
|
MiMo-V2.5 Flash |
0,10 доллара |
0,30 доллара |
0,40 доллара |
Сяоми МиМо |
|
deepseek-v4-flash |
0,14 доллара |
0,28 доллара |
0,42 доллара |
DeepSeek |
|
deepseek-v4-pro |
0,435 доллара |
0,87 доллара |
1,305 доллара |
DeepSeek |
|
МиниМакс-М3 |
0,30 доллара |
1,20 доллара |
1,50 доллара |
МиниМакс |
|
Qwen3.7-Plus |
0,40 доллара |
1,60 доллара |
2,00 доллара |
Alibaba Cloud |
|
Фонарик Gemini 3.1 |
0,25 доллара |
1,50 доллара |
1,75 доллара |
|
|
MiMo-V2.5 |
0,40 доллара |
2,00 доллара |
2,40 доллара |
Сяоми МиМо |
|
Grok 4.3 низкий контекст |
1,25 доллара |
2,50 доллара |
3,75 доллара |
xAI |
|
ГЛМ-5 |
1,00 долл. |
3,20 доллара |
4,20 доллара |
З.ай |
|
Кими-К2.6 |
0,95 доллара |
4,00 доллара |
4,95 доллара |
Муншот/Кими |
|
GLM-5.1 |
1,40 доллара |
4,40 доллара |
5,80 долларов |
З.ай |
|
Grok 4.3 высокий контекст |
2,50 доллара |
5,00 долларов |
7,50 долларов |
xAI |
|
Qwen3.7-Max |
2,50 доллара |
7,50 долларов |
10,00 долларов |
Alibaba Cloud |
|
Вспышка Gemini 3.5 |
1,50 доллара |
9,00 долларов |
10,50 долларов |
|
|
Gemini 3.1 Pro Preview ≤200K |
2,00 доллара |
12,00 долларов |
14,00 долларов |
|
|
ГПТ-5.4 |
2,50 доллара |
15,00 долларов |
17,50 долларов |
OpenAI |
|
Gemini 3.1 Pro Preview >200K |
4,00 доллара |
18,00 долларов |
22,00 долларов |
|
|
Клод Опус 4.8 |
5,00 долларов |
25,00 долларов |
30,00 долларов |
Антропический |
|
ГПТ-5.5 |
5,00 долларов |
30,00 долларов |
35,00 долларов |
OpenAI |
Поддержание непрерывности работы в сложных циклах выполнения инструментов.
Для технических специалистов, принимающих решения о внедрении автономных агентов, основным узким местом редко оказывается начальный уровень интеллекта модели. Вместо этого, это затухание состояния — тенденция агентной структуры терять свою аналитическую траекторию на протяжении многоэтапных задач с длительным горизонтом планирования.
Qwen3.7-Plus устраняет эту архитектурную уязвимость за счет комбинированного подхода к управлению контекстом и сохранению состояния логических рассуждений.
Модель поставляется с контекстным окном в 1 миллион токенов и выделяет до 256 тысяч токенов специально для внутренней обработки цепочки рассуждений. Чтобы представить себе масштаб этой возможности, вообразите автоматизированного агента миграции в облако: он может обработать весь код, составить карту зависимостей и потратить тысячи токенов на незаметную оценку крайних случаев, прежде чем выполнить хотя бы одну строку bash-скрипта.
Что особенно важно, API предоставляет параметр под названием «preserve_thinking». В экосистеме Alibaba эта возможность служит стандартизированным архитектурным мостом, а не многоуровневым преимуществом. Alibaba представила эту функцию в предыдущем поколении Qwen 3.6, интегрировав ее как в модель Qwen3.6-27B с открытым исходным кодом, так и в проприетарные модели Max.
По сути, этот параметр работает на уровне API и шаблона, сохраняя внутренние блоки
Эта структурная непрерывность устраняет критическое узкое место для разработчиков, создающих задачи с длительным горизонтом планирования. Сохраняя эти внутренние логические циклы в неизменном виде, эта функция предотвращает потерю контекста моделью или ненужный пересчет кэшированной истории в середине операции.
Когда модель выполняет сложные, многоэтапные задачи кодирования действий агента, такое сохранение позволяет системе придерживаться первоначальной цепочки мыслей, не теряя нить повествования и не забывая лежащую в основе логику своих предыдущих действий.
Компания Alibaba далеко не единственная, кто осознает эту техническую необходимость, поскольку лежащая в ее основе концепция теперь определяет архитектуру почти всех крупных лабораторий искусственного интеллекта.
Компания Anthropic использует именно эту возможность под названием «Расширенное мышление» для своих продвинутых моделей, включая последнюю версию Claude Opus 4.8. Эта структура требует от разработчиков передавать неизмененные блоки мышления непосредственно обратно в API на последующих этапах, чтобы поддерживать непрерывную цепочку рассуждений.
OpenAI решает ту же задачу с помощью механизма зашифрованной передачи результатов рассуждений для таких моделей, как GPT-5.5. В экосистеме OpenAI разработчики должны возвращать конкретные элементы рассуждений, сгенерированные вместе с предыдущими вызовами функций, гарантируя, что модель явно запоминает обоснование выполнения своих инструментов.
В конечном счете, preserve_thinking — это просто терминология Alibaba, обозначающая то, что быстро стало бесспорным базовым принципом современного многоэтапного мышления.
Результаты сравнительных тестов показывают конкурентоспособную, но не самую передовую модель.
С точки зрения базовых показателей производительности, эта глубоко продуманная архитектура обеспечивает структурные преимущества в многомодальных и агентных тестах. Однако она все еще уступает многим ведущим и предыдущим поколениям американских проприетарных моделей, таким как Claude Opus 4.6 от Anthropic и GPT-5.4 от OpenAI.

В тесте Terminal Bench 2.0-Terminus , который измеряет способность модели безопасно и итеративно выполнять реальный код на уровне терминала, Qwen3.7-Plus набрала 70,3 балла , опередив DeepSeek-V4-Pro Max (67,9) и Gemini-3.1 Pro (63,5).
В тестах компьютерного зрения, требующих понимания локализованного интерфейса, таких как ScreenSpot Pro , модель показала результат 79,0 , значительно опередив таких лидеров отрасли, как GPT-5.4 (xhigh) с результатом 67,4 и Claude-Opus-4.6 с результатом 49,5. Метрики оценки агентов (выбранные тесты)
Для чего предприятиям следует рассматривать Qwen3.7-Plus?
Для корпоративного архитектора ключевой вопрос при анализе Qwen3.7-Plus ясен: что он заменяет в нашем текущем технологическом стеке?
Данная модель разработана для прямой замены передовых моделей (таких как модели GPT-5-tier или Claude-Max-tier) в высокочастотных рабочих процессах разработчиков, роботизированной автоматизации процессов (RPA) и конвейерах обработки данных.
Вместо того чтобы использовать дорогостоящую универсальную флагманскую модель для выполнения повторяющихся системных операций, технические специалисты могут перенаправить эти задачи на Qwen3.7-Plus. Она одновременно обрабатывает интерпретацию визуального интерфейса, выполнение команд и генерацию кода.
Компания Alibaba выстроила свою систему предоставления API таким образом, чтобы она соответствовала существующим корпоративным платформам с открытым исходным кодом и проприетарным решениям. Конечные точки полностью совместимы с OpenAI, что означает, что замена существующих зависимостей требует минимальной корректировки инфраструктуры. Для групп, использующих автономные терминальные платформы, интеграция поддерживается изначально в различных средах.
Инженеры могут запускать Qwen3.7-Plus непосредственно через локальные настройки терминала, изменяя целевые параметры базовой среды.
С точки зрения чистой стоимости, запуск агентской платформы, которая постоянно обращается к огромным репозиториям кода или истории визуального оформления, может быстро стать непомерно дорогим.
Alibaba решает эту проблему, предоставляя возможность детального ценообразования для кэширования.
Стандартная обработка входных данных обходится в 0,40 доллара за миллион токенов, но если агент считывает данные из специально созданного кэша (например, из огромного базового хранилища или стандартного корпоративного набора пользовательских интерфейсов, который остается неизменным на протяжении сотен автоматизированных циклов), стоимость резко снижается до 0,04 доллара за 1 миллион токенов при последующих чтениях.
Этот уровень делает экономически целесообразным проведение высокочастотных многоэтапных итераций работы агентов в масштабах предприятия.
Отсутствие лицензий с открытым исходным кодом или открытых весов поднимает вопрос соответствия требованиям для предприятий.
При оценке любой модели в экосистеме Qwen первостепенное значение для юридических и служб безопасности имеет лицензионная структура и операционные границы конвейера обработки данных.
В то время как предыдущие версии семейства Qwen получили значительное распространение в корпоративном секторе благодаря полностью открытому исходному коду, доступному под лицензией Apache 2.0 или на основе специализированных лицензий с открытым доступом, Qwen 3.7-Plus предоставляется исключительно как управляемый коммерческий облачный API через Alibaba Cloud Model Studio. Для управления рисками в корпоративной среде это различие имеет определенные последствия:
-
Отсутствие локального развертывания весов : Организации не могут загружать, изолировать или размещать веса Qwen3.7-Plus локально в своих полностью изолированных внутренних центрах обработки данных. Все проверки данных, визуальная обработка и вызовы выполнения должны проходить через международные конечные точки Alibaba Cloud (например, сингапурский экземпляр, указанный в документации для разработчиков).
-
Соответствие требованиям и суверенитет : Поскольку модель требует использования облачных вычислений, компании, работающие в условиях строгих ограничений, связанных с суверенитетом данных (например, медицинские учреждения, подпадающие под действие местных ограничений HIPAA/GDPR, или оборонные подрядчики), должны явно оценить, соответствует ли маршрутизация внешних API их конкретным обязательствам по размещению данных.
-
Управляемое снижение рисков : Напротив, управляемая структура API снимает нагрузку с внутренней инфраструктуры, связанную с выделением, оптимизацией и обслуживанием кластеров с несколькими графическими процессорами (таких как выделенные массивы Nvidia H100) просто для размещения внутренней сети агентов.
Тем не менее, Qwen3.7-Plus предлагает высокий уровень интеллекта во всех режимах работы по низкой цене.
Первоначальная реакция со стороны сообществ разработчиков и венчурных фондов, специализирующихся на технических проектах, подчеркивает меняющуюся экономику развертывания агентов.
Известный отраслевой эксперт и венчурный капиталист в сфере Web3 @Boxmining подчеркнул стратегическое преимущество в плане затрат, заявив:
«То, что Qwen 3.7 Plus на 40% дешевле, чем Max, меняет ситуацию. Если результат достаточно близок для большинства задач программирования и значительно превосходит возможности визуальных рабочих процессов, действительно ли вам нужен Max каждый день или только для ресурсоемких задач, выполняемых исключительно в терминале?»
Эта точка зрения соответствует современной тенденции оптимизации операционных бюджетов предприятий: переход от необработанных, ничем не ограниченных вычислительных ресурсов к целенаправленной автоматизации задач. В то же время, специалисты-исследователи, глубоко погруженные в эту экосистему, указывают на то, что это не просто постепенная оптимизация генерации текста.
Дунцзе Лу, стажер-исследователь в Alibaba Qwen, отметил:
«Он демонстрирует явные преимущества перед Qwen3.6-Plus в возможностях использования компьютера, с более широким спектром применения, выходящим за рамки обычных задач на рабочем столе и охватывающим профессиональные рабочие процессы, такие как обработка данных и научные исследования».
В конечном итоге, для корпоративных покупателей, определяющих свою следующую дорожную карту инфраструктуры, Qwen3.7-Plus представляет собой практичную альтернативу. Если основная цель вашей организации — создание отказоустойчивых, визуально привлекательных автономных программных циклов, взаимодействующих напрямую со средами разработки и облачными консолями, без превышения бюджета на вывод данных, то эта модель предоставляет убедительную причину для отказа от более дорогостоящих альтернативных решений.
Подпишитесь, чтобы получать самые свежие новости!
Подробные аналитические данные для руководителей предприятий в области искусственного интеллекта, данных и безопасности.
Отправляя свой адрес электронной почты, вы соглашаетесь с нашими Условиями использования и Политикой конфиденциальности.
Получайте обновления ! Вы подписаны! Наши последние новости скоро поступят на вашу электронную почту.
Источник: venturebeat.com

Добавить комментарий
Для отправки комментария вам необходимо авторизоваться.