Закажи экспресс-аудит своего дела онлайн всего за 199 ₽
и получи рекомендации по улучшению - Жми сюда !

Платформа Qwen3.7-Plus от Alibaba поддерживает ввод текста, видео и изображений по низкой цене 0,4/1,6 доллара США за 1 миллион токенов — но она является собственной разработкой.

Карл Франзен

Изображение капибары на картине (PC).

Источник: VentureBeat, создано с использованием OpenAI ChatGPT-Images-2.0 и Google Nana Banana 2.

На этой неделе Alibaba выпустила Qwen3.7-Plus, новейшую модель обработки больших языков (LLM) на основе искусственного интеллекта в своем популярном и постоянно расширяющемся семействе Qwen, которая может похвастаться расширенными возможностями мультимодальной обработки и на 60% меньшей стоимостью, чем предыдущая модель Qwen3.7-Max, предназначенная только для работы с текстом и выпущенная всего несколько недель назад.

Однако, как и его непосредственный предшественник, Qwen3.7-Plus доступен только по «закрытой» коммерческой лицензии через собственные интерфейсы прикладного программирования (API) и Qwen Chat.

Это знаменует собой серьезный отход от стратегии Qwen, которая до сих пор была сосредоточена в основном на выпуске мощных, почти передовых моделей с открытым исходным кодом. Предприятия и пользователи, которые полагались на модели Qwen с открытым исходным кодом — среди них такие американские гиганты, как Airbnb — несомненно, будут разочарованы, узнав, что Alibaba закрывает доступ к своим новым продуктам.

Тем не менее, эта модель заслуживает внимания из-за своей низкой стоимости и высокой производительности в многомодальных задачах, таких как создание визуализаций корпоративного уровня или анализ видео, изображений и скриншотов, чего не может сделать Qwen3.7-Max (он работает только с текстом). Это одна из самых дешевых и мощных моделей с искусственным интеллектом, доступных сейчас, и по цене она немного выше, чем новый китайский конкурент MiniMax-M3, который сейчас продается со скидкой в течение ограниченного времени.

Сводка цен на API для моделей искусственного интеллекта VentureBeat Frontier.

Модель

Вход

Выход

Общая стоимость

Источник

MiMo-V2.5 Flash

0,10 доллара

0,30 доллара

0,40 доллара

Сяоми МиМо

deepseek-v4-flash

0,14 доллара

0,28 доллара

0,42 доллара

DeepSeek

deepseek-v4-pro

0,435 доллара

0,87 доллара

1,305 доллара

DeepSeek

МиниМакс-М3

0,30 доллара

1,20 доллара

1,50 доллара

МиниМакс

Qwen3.7-Plus

0,40 доллара

1,60 доллара

2,00 доллара

Alibaba Cloud

Фонарик Gemini 3.1

0,25 доллара

1,50 доллара

1,75 доллара

Google

MiMo-V2.5

0,40 доллара

2,00 доллара

2,40 доллара

Сяоми МиМо

Grok 4.3 низкий контекст

1,25 доллара

2,50 доллара

3,75 доллара

xAI

ГЛМ-5

1,00 долл.

3,20 доллара

4,20 доллара

З.ай

Кими-К2.6

0,95 доллара

4,00 доллара

4,95 доллара

Муншот/Кими

GLM-5.1

1,40 доллара

4,40 доллара

5,80 долларов

З.ай

Grok 4.3 высокий контекст

2,50 доллара

5,00 долларов

7,50 долларов

xAI

Qwen3.7-Max

2,50 доллара

7,50 долларов

10,00 долларов

Alibaba Cloud

Вспышка Gemini 3.5

1,50 доллара

9,00 долларов

10,50 долларов

Google

Gemini 3.1 Pro Preview ≤200K

2,00 доллара

12,00 долларов

14,00 долларов

Google

ГПТ-5.4

2,50 доллара

15,00 долларов

17,50 долларов

OpenAI

Gemini 3.1 Pro Preview >200K

4,00 доллара

18,00 долларов

22,00 долларов

Google

Клод Опус 4.8

5,00 долларов

25,00 долларов

30,00 долларов

Антропический

ГПТ-5.5

5,00 долларов

30,00 долларов

35,00 долларов

OpenAI

Поддержание непрерывности работы в сложных циклах выполнения инструментов.

Для технических специалистов, принимающих решения о внедрении автономных агентов, основным узким местом редко оказывается начальный уровень интеллекта модели. Вместо этого, это затухание состояния — тенденция агентной структуры терять свою аналитическую траекторию на протяжении многоэтапных задач с длительным горизонтом планирования.

Qwen3.7-Plus устраняет эту архитектурную уязвимость за счет комбинированного подхода к управлению контекстом и сохранению состояния логических рассуждений.

Модель поставляется с контекстным окном в 1 миллион токенов и выделяет до 256 тысяч токенов специально для внутренней обработки цепочки рассуждений. Чтобы представить себе масштаб этой возможности, вообразите автоматизированного агента миграции в облако: он может обработать весь код, составить карту зависимостей и потратить тысячи токенов на незаметную оценку крайних случаев, прежде чем выполнить хотя бы одну строку bash-скрипта.

Что особенно важно, API предоставляет параметр под названием «preserve_thinking». В экосистеме Alibaba эта возможность служит стандартизированным архитектурным мостом, а не многоуровневым преимуществом. Alibaba представила эту функцию в предыдущем поколении Qwen 3.6, интегрировав ее как в модель Qwen3.6-27B с открытым исходным кодом, так и в проприетарные модели Max.

По сути, этот параметр работает на уровне API и шаблона, сохраняя внутренние блоки на протяжении непрерывных диалогов.

Эта структурная непрерывность устраняет критическое узкое место для разработчиков, создающих задачи с длительным горизонтом планирования. Сохраняя эти внутренние логические циклы в неизменном виде, эта функция предотвращает потерю контекста моделью или ненужный пересчет кэшированной истории в середине операции.

Когда модель выполняет сложные, многоэтапные задачи кодирования действий агента, такое сохранение позволяет системе придерживаться первоначальной цепочки мыслей, не теряя нить повествования и не забывая лежащую в основе логику своих предыдущих действий.

Компания Alibaba далеко не единственная, кто осознает эту техническую необходимость, поскольку лежащая в ее основе концепция теперь определяет архитектуру почти всех крупных лабораторий искусственного интеллекта.

Компания Anthropic использует именно эту возможность под названием «Расширенное мышление» для своих продвинутых моделей, включая последнюю версию Claude Opus 4.8. Эта структура требует от разработчиков передавать неизмененные блоки мышления непосредственно обратно в API на последующих этапах, чтобы поддерживать непрерывную цепочку рассуждений.

OpenAI решает ту же задачу с помощью механизма зашифрованной передачи результатов рассуждений для таких моделей, как GPT-5.5. В экосистеме OpenAI разработчики должны возвращать конкретные элементы рассуждений, сгенерированные вместе с предыдущими вызовами функций, гарантируя, что модель явно запоминает обоснование выполнения своих инструментов.

В конечном счете, preserve_thinking — это просто терминология Alibaba, обозначающая то, что быстро стало бесспорным базовым принципом современного многоэтапного мышления.

Результаты сравнительных тестов показывают конкурентоспособную, но не самую передовую модель.

С точки зрения базовых показателей производительности, эта глубоко продуманная архитектура обеспечивает структурные преимущества в многомодальных и агентных тестах. Однако она все еще уступает многим ведущим и предыдущим поколениям американских проприетарных моделей, таким как Claude Opus 4.6 от Anthropic и GPT-5.4 от OpenAI.

Сравнительная таблица результатов тестов Qwen3.7-Plus

Сравнительная таблица результатов тестов Qwen3.7-Plus. Источник: Alibaba Qwen.

В тесте Terminal Bench 2.0-Terminus , который измеряет способность модели безопасно и итеративно выполнять реальный код на уровне терминала, Qwen3.7-Plus набрала 70,3 балла , опередив DeepSeek-V4-Pro Max (67,9) и Gemini-3.1 Pro (63,5).

В тестах компьютерного зрения, требующих понимания локализованного интерфейса, таких как ScreenSpot Pro , модель показала результат 79,0 , значительно опередив таких лидеров отрасли, как GPT-5.4 (xhigh) с результатом 67,4 и Claude-Opus-4.6 с результатом 49,5. Метрики оценки агентов (выбранные тесты)

Для чего предприятиям следует рассматривать Qwen3.7-Plus?

Для корпоративного архитектора ключевой вопрос при анализе Qwen3.7-Plus ясен: что он заменяет в нашем текущем технологическом стеке?

Данная модель разработана для прямой замены передовых моделей (таких как модели GPT-5-tier или Claude-Max-tier) в высокочастотных рабочих процессах разработчиков, роботизированной автоматизации процессов (RPA) и конвейерах обработки данных.

Вместо того чтобы использовать дорогостоящую универсальную флагманскую модель для выполнения повторяющихся системных операций, технические специалисты могут перенаправить эти задачи на Qwen3.7-Plus. Она одновременно обрабатывает интерпретацию визуального интерфейса, выполнение команд и генерацию кода.

Компания Alibaba выстроила свою систему предоставления API таким образом, чтобы она соответствовала существующим корпоративным платформам с открытым исходным кодом и проприетарным решениям. Конечные точки полностью совместимы с OpenAI, что означает, что замена существующих зависимостей требует минимальной корректировки инфраструктуры. Для групп, использующих автономные терминальные платформы, интеграция поддерживается изначально в различных средах.

Инженеры могут запускать Qwen3.7-Plus непосредственно через локальные настройки терминала, изменяя целевые параметры базовой среды.

С точки зрения чистой стоимости, запуск агентской платформы, которая постоянно обращается к огромным репозиториям кода или истории визуального оформления, может быстро стать непомерно дорогим.

Alibaba решает эту проблему, предоставляя возможность детального ценообразования для кэширования.

Стандартная обработка входных данных обходится в 0,40 доллара за миллион токенов, но если агент считывает данные из специально созданного кэша (например, из огромного базового хранилища или стандартного корпоративного набора пользовательских интерфейсов, который остается неизменным на протяжении сотен автоматизированных циклов), стоимость резко снижается до 0,04 доллара за 1 миллион токенов при последующих чтениях.

Этот уровень делает экономически целесообразным проведение высокочастотных многоэтапных итераций работы агентов в масштабах предприятия.

Отсутствие лицензий с открытым исходным кодом или открытых весов поднимает вопрос соответствия требованиям для предприятий.

При оценке любой модели в экосистеме Qwen первостепенное значение для юридических и служб безопасности имеет лицензионная структура и операционные границы конвейера обработки данных.

В то время как предыдущие версии семейства Qwen получили значительное распространение в корпоративном секторе благодаря полностью открытому исходному коду, доступному под лицензией Apache 2.0 или на основе специализированных лицензий с открытым доступом, Qwen 3.7-Plus предоставляется исключительно как управляемый коммерческий облачный API через Alibaba Cloud Model Studio. Для управления рисками в корпоративной среде это различие имеет определенные последствия:

  • Отсутствие локального развертывания весов : Организации не могут загружать, изолировать или размещать веса Qwen3.7-Plus локально в своих полностью изолированных внутренних центрах обработки данных. Все проверки данных, визуальная обработка и вызовы выполнения должны проходить через международные конечные точки Alibaba Cloud (например, сингапурский экземпляр, указанный в документации для разработчиков).

  • Соответствие требованиям и суверенитет : Поскольку модель требует использования облачных вычислений, компании, работающие в условиях строгих ограничений, связанных с суверенитетом данных (например, медицинские учреждения, подпадающие под действие местных ограничений HIPAA/GDPR, или оборонные подрядчики), должны явно оценить, соответствует ли маршрутизация внешних API их конкретным обязательствам по размещению данных.

  • Управляемое снижение рисков : Напротив, управляемая структура API снимает нагрузку с внутренней инфраструктуры, связанную с выделением, оптимизацией и обслуживанием кластеров с несколькими графическими процессорами (таких как выделенные массивы Nvidia H100) просто для размещения внутренней сети агентов.

Тем не менее, Qwen3.7-Plus предлагает высокий уровень интеллекта во всех режимах работы по низкой цене.

Первоначальная реакция со стороны сообществ разработчиков и венчурных фондов, специализирующихся на технических проектах, подчеркивает меняющуюся экономику развертывания агентов.

Известный отраслевой эксперт и венчурный капиталист в сфере Web3 @Boxmining подчеркнул стратегическое преимущество в плане затрат, заявив:

«То, что Qwen 3.7 Plus на 40% дешевле, чем Max, меняет ситуацию. Если результат достаточно близок для большинства задач программирования и значительно превосходит возможности визуальных рабочих процессов, действительно ли вам нужен Max каждый день или только для ресурсоемких задач, выполняемых исключительно в терминале?»

Эта точка зрения соответствует современной тенденции оптимизации операционных бюджетов предприятий: переход от необработанных, ничем не ограниченных вычислительных ресурсов к целенаправленной автоматизации задач. В то же время, специалисты-исследователи, глубоко погруженные в эту экосистему, указывают на то, что это не просто постепенная оптимизация генерации текста.

Дунцзе Лу, стажер-исследователь в Alibaba Qwen, отметил:

«Он демонстрирует явные преимущества перед Qwen3.6-Plus в возможностях использования компьютера, с более широким спектром применения, выходящим за рамки обычных задач на рабочем столе и охватывающим профессиональные рабочие процессы, такие как обработка данных и научные исследования».

В конечном итоге, для корпоративных покупателей, определяющих свою следующую дорожную карту инфраструктуры, Qwen3.7-Plus представляет собой практичную альтернативу. Если основная цель вашей организации — создание отказоустойчивых, визуально привлекательных автономных программных циклов, взаимодействующих напрямую со средами разработки и облачными консолями, без превышения бюджета на вывод данных, то эта модель предоставляет убедительную причину для отказа от более дорогостоящих альтернативных решений.

Подпишитесь, чтобы получать самые свежие новости!

Подробные аналитические данные для руководителей предприятий в области искусственного интеллекта, данных и безопасности.

VB Daily AI Weekly Еженедельник AGI Еженедельник по безопасности Еженедельник по инфраструктуре данных Мероприятия VB Все они

Отправляя свой адрес электронной почты, вы соглашаетесь с нашими Условиями использования и Политикой конфиденциальности.

Получайте обновления ! Вы подписаны! Наши последние новости скоро поступят на вашу электронную почту.

Источник: venturebeat.com

✅ Найденные теги: Alibaba, Plus, Qwen3, новости, Платформа, Поддерживает

Добавить комментарий

Новости других рубрик

Архив рубрики ~Лента новостей~: Как Турция взломала индустрию пересадки волос Архив рубрики ~Лента новостей~: 5 интересных статей, которые ясно объясняют суть магистерских программ (LLM). Архив рубрики ~Лента новостей~: Компания Ultrahuman утверждает, что хакеры получили доступ к данным о состоянии здоровья клиентов через внутренний инструмент. Архив рубрики ~Лента новостей~: AI inference на K8s: как выживать с LLM в кубере. DRA, GIE, LLM-D Архив рубрики ~Лента новостей~: Как компания E.ON использует SAP S/4HANA для модернизации энергосети с помощью ИИ Архив рубрики ~Лента новостей~: Компания Alphabet, владеющая Google, продаст акции на сумму 80 миллиардов долларов для финансирования масштабных инвестиций в искусственный интеллект. Архив рубрики ~Лента новостей~: [Перевод] Астрономы разглядели галактику, возникшую всего через 800 млн лет после Большого взрыва Архив рубрики ~Лента новостей~: Выпускники аплодируют, когда Стив Возняк говорит им, что человеческий интеллект все еще имеет значение