Image

Небольшой, открытый программный продукт Alibaba Qwen3.5-9B превосходит gpt-oss-120B от OpenAI и может работать на стандартных ноутбуках.

Карл Франзен

Маленькая капибара Квен танцует на ноутбуке, а пользователи с восторгом и изумлением наблюдают за ней в стиле каваи (плоская иллюстрация).

Источник: VentureBeat, создано с помощью Google Gemini 3 Pro.

Несмотря на политические потрясения в американском секторе ИИ, в Китае развитие искусственного интеллекта продолжается быстрыми темпами и без каких-либо препятствий.

Сегодня команда исследователей в области искусственного интеллекта Qwen, принадлежащая гиганту электронной коммерции Alibaba и занимающаяся разработкой и выпуском в мир растущего семейства мощных и функциональных моделей искусственного интеллекта с открытым исходным кодом Qwen, представила свою новейшую линейку — серию малых моделей Qwen3.5, в которую входят:

  • Qwen3.5-0.8B и 2B: Две модели, оптимизированные для «миниатюрных» и «быстрых» устройств, предназначенные для прототипирования и развертывания на периферийных устройствах, где время автономной работы имеет первостепенное значение.

  • Qwen3.5-4B: Мощная многомодальная база для легковесных агентов, изначально поддерживающая контекстное окно из 262 144 токенов.

  • Qwen3.5-9B — компактная модель логического мышления, превосходящая по производительности в 13,5 раз более крупный американский конкурент OpenAI gpt-oss-120B по ключевым сторонним тестам, включая многоязычные знания и логическое мышление на уровне аспирантуры.

Чтобы было понятно, эти модели по размерам сопоставимы с самыми маленькими универсальными моделями, выпущенными в последнее время любой лабораторией в мире, и больше похожи на серию LFM2 от LiquidAI (подразделение MIT), которая также содержит несколько сотен миллионов или миллиардов параметров, чем на триллионы параметров (настроек модели), которые, как сообщается, используются для флагманских моделей от OpenAI, Anthropic и серии Gemini от Google.

Весовые коэффициенты для моделей доступны прямо сейчас по всему миру под лицензиями Apache 2.0 — идеально подходящими для корпоративного и коммерческого использования, включая настройку по мере необходимости — на платформах Hugging Face и ModelScope.

Технология: гибридная эффективность и встроенная многомодальность

В основе малой серии Qwen3.5 лежит отход от стандартных архитектур Transformer. Alibaba перешла к эффективной гибридной архитектуре, которая сочетает в себе сети Gated Delta Networks (форма линейного внимания) с разреженными сетями Mixture-of-Experts (MoE).

Этот гибридный подход решает проблему «ограничения памяти», которая обычно сдерживает небольшие модели; благодаря использованию Gated Delta Networks, модели достигают более высокой пропускной способности и значительно меньшей задержки во время вывода.

Кроме того, эти модели изначально являются мультимодальными. В отличие от предыдущих поколений, которые «прикрепляли» кодировщик изображений к текстовой модели, Qwen3.5 обучалась с использованием раннего слияния на мультимодальных токенах. Это позволяет моделям 4B и 9B демонстрировать уровень визуального понимания — например, чтение элементов пользовательского интерфейса или подсчет объектов в видео — который ранее требовал моделей в десять раз большего размера.

Сравнительный анализ «малых» серий: производительность, не поддающаяся масштабированию.

Недавно опубликованные данные сравнительных тестов наглядно демонстрируют, насколько агрессивно эти компактные модели конкурируют с гораздо более крупными отраслевыми стандартами и зачастую превосходят их. Варианты Qwen3.5-9B и Qwen3.5-4B демонстрируют межпоколенческий скачок в эффективности, особенно в задачах, требующих мультимодального мышления и логического вывода.

Тесты серии Qwen3.5 Small Models

Сравнительные тесты серии Qwen3.5 Small Models в сравнении с другими моделями аналогичного размера/класса. Источник: Alibaba Qwen

Превосходство в мультимодальном анализе: в бенчмарке визуального мышления MMMU-Pro Qwen3.5-9B показал результат 70,1, превзойдя Gemini 2.5 Flash-Lite (59,7) и даже специализированный Qwen3-VL-30B-A3B (63,0).

Логика на уровне аспирантуры: В бенчмарке GPQA Diamond модель 9B достигла результата 81,7, превзойдя gpt-oss-120b (80,1), модель, у которой количество параметров более чем в десять раз превышает её показатель.

Понимание видео: Серия демонстрирует выдающиеся результаты в анализе видеоконтента. В тесте Video-MME (с субтитрами) Qwen3.5-9B набрал 84,5 балла, а 4B — 83,5 балла, значительно опередив Gemini 2.5 Flash-Lite (74,6).

Математические достижения: В ходе оценки HMMT в феврале 2025 года (математический турнир Гарвард-Массачусетский технологический институт) модель 9B набрала 83,2 балла, а вариант 4B — 74,0, что доказывает, что для решения сложных задач в области STEM больше не требуются огромные вычислительные кластеры.

Знание документов и многоязычность: Вариант 9B лидирует в распознавании документов в OmniDocBench v1.5 с результатом 87,7. При этом он сохраняет лидирующие позиции по многоязычности в MMMLU с результатом 81,2, превосходя gpt-oss-120b (78,2).

Реакция сообщества: «больше интеллекта, меньше вычислительных ресурсов»

Вслед за выпущенной на прошлой неделе довольно компактной и мощной открытой версией Qwen3.5-Medium, способной работать на одном графическом процессоре, анонс серии Qwen3.5-Small Models с еще меньшими размерами и вычислительными требованиями сразу же вызвал интерес у разработчиков, ориентированных на ИИ с приоритетом локальных вычислений.

Фраза «Больше интеллекта, меньше вычислительных ресурсов» нашла отклик у пользователей, ищущих альтернативы облачным моделям.

Преподаватель в области искусственного интеллекта и технологий Пол Куверт из компании Blueshell AI запечатлел шок отрасли по поводу этого скачка в эффективности.

«Как это вообще возможно?!» — написал Куверт на X. «Компания Qwen выпустила 4 новые модели, и версия 4B почти так же функциональна, как предыдущая 80B A3B. А 9B так же хороша, как GPT OSS 120b, при этом она в 13 раз меньше!»

Анализ Куверта подчеркивает практические последствия этих архитектурных достижений:

  • «Они могут работать на любом ноутбуке»

  • «0,8 млрд и 2 млрд для вашего телефона»

  • «Офлайн и с открытым исходным кодом»

Как сказал разработчик Каран Кендре из Kargul Studio: «Эти модели [могут запускаться] локально на моем MacBook Air с процессором M1 совершенно бесплатно».

Такое ощущение «удивительной» доступности разделяют многие разработчики. Один из пользователей отметил, что модель 4B, служащая «мощной мультимодальной базой», «меняет правила игры для мобильных разработчиков», которым необходимы возможности чтения с экрана без высокой нагрузки на процессор.

Действительно, разработчик Hugging Face, компания Xenova, отметила, что новая серия Qwen3.5 Small Model может даже работать непосредственно в веб-браузере пользователя и выполнять такие сложные и ранее требующие больших вычислительных ресурсов операции, как анализ видео.

Исследователи также высоко оценили выпуск базовых моделей наряду с версиями Instruct, отметив, что это обеспечивает необходимую поддержку для «реальных промышленных инноваций».

Выпуск базовых моделей особенно ценится корпоративными и исследовательскими группами, поскольку он предоставляет «чистый лист», не искаженный определенным набором данных RLHF (обучение с подкреплением на основе обратной связи от человека) или SFT (контролируемая тонкая настройка), которые часто приводят к «отказам» или специфическим стилям общения, которые трудно исправить.

Теперь, с появлением базовых моделей, тем, кто заинтересован в настройке модели под конкретные задачи и цели, стало проще начать, поскольку они могут применять собственные настройки инструкций и постобучение, не отказываясь от готовых решений Alibaba.

Лицензирование: победа для открытой экосистемы

Компания Alibaba опубликовала данные о весе и конфигурационные файлы для серии Qwen3.5 под лицензией Apache 2.0. Эта разрешительная лицензия позволяет использовать, модифицировать и распространять устройства в коммерческих целях без уплаты роялти, устраняя «привязку к поставщику», связанную с проприетарными API.

  • Коммерческое использование: Разработчики могут интегрировать модели в коммерческие продукты без выплаты лицензионных отчислений.

  • Модификация: Команды могут дорабатывать (SFT) или применять RLHF для создания специализированных версий.

  • Распространение: Модели могут быть перераспределены в приложениях ИИ, ориентированных на локальное размещение, таких как Ollama.

Анализ новостей в контексте: почему мелочи так важны сейчас.

Выпуск Qwen3.5 Small Series приходится на момент «перестройки агентских систем». Мы отошли от простых чат-ботов; теперь цель — автономность. Автономный агент должен «думать» (рассуждать), «видеть» (мультимодальность) и «действовать» (использование инструментов). Хотя реализация этого с помощью моделей с триллионами параметров обходится непомерно дорого, локальный Qwen3.5-9B может выполнять эти циклы за гораздо меньшую стоимость.

Благодаря масштабированию обучения с подкреплением (RL) в средах с миллионами агентов, Alibaba наделила эти небольшие модели «человеческим суждением», что позволяет им обрабатывать многоэтапные задачи, такие как организация рабочего стола или обратное проектирование видеозаписей игрового процесса в код. Будь то модель с 0,8 млрд пикселей, работающая на смартфоне, или модель с 9 млрд пикселей, питающая терминал для программирования, серия Qwen3.5 фактически демократизирует «эпоху агентов».

Переход серии Qwen3.5 от «чатбитов» к «собственным мультимодальным агентам» меняет подход предприятий к распределению интеллектуальных ресурсов. Переместив сложные логические вычисления на «периферию» — отдельные устройства и локальные серверы — организации могут автоматизировать задачи, которые ранее требовали дорогостоящих облачных API или обработки с высокой задержкой.

Стратегические аспекты применения и применения на предприятиях

Модели от 0.8B до 9B были модернизированы для повышения эффективности за счет использования гибридной архитектуры, которая активирует только необходимые части сети для каждой задачи.

  • Визуальная автоматизация рабочих процессов: используя «привязку на уровне пикселей», эти модели могут перемещаться по пользовательским интерфейсам настольных или мобильных устройств, заполнять формы и организовывать файлы на основе инструкций на естественном языке.

  • Сложный анализ документов: благодаря результатам, превышающим 90% в тестах на понимание документов, они могут заменить отдельные конвейеры оптического распознавания текста и анализа структуры для извлечения структурированных данных из различных форм и диаграмм.

  • Автономное кодирование и рефакторинг: предприятия могут загружать целые репозитории (до 400 000 строк кода) в контекстное окно размером 1 млн символов для рефакторинга, готового к использованию в производственной среде, или для автоматической отладки.

  • Анализ данных в реальном времени: модели 0.8B и 2B разработаны для мобильных устройств и позволяют создавать видеорезюме в автономном режиме (до 60 секунд при 8 кадрах в секунду) и выполнять пространственное мышление без существенного расхода заряда батареи.

В таблице ниже показано, какие корпоративные функции получат наибольшую выгоду от локального развертывания в небольших масштабах.

Функция

Основное преимущество

Ключевой вариант использования

Программная инженерия

Локальный код интеллекта

Рефакторинг всего репозитория и терминальное агентное программирование.

Операции и ИТ

Безопасная автоматизация

Автоматизация многоэтапных задач настройки системы и управления файлами локально.

Продукт и UX

Взаимодействие на границе

Интеграция встроенных многомодальных систем логического мышления непосредственно в мобильные/настольные приложения.

Данные и аналитика

Эффективная экстракция

Высокоточное оптическое распознавание символов и извлечение структурированных данных из сложных визуальных отчетов.

Несмотря на высокую производительность этих моделей, их малый масштаб и «агентная» природа вводят специфические операционные «сигналы», за которыми команды должны следить.

  • Каскад галлюцинаций: В многоэтапных «агентных» рабочих процессах небольшая ошибка на раннем этапе может привести к «каскаду» сбоев, когда агент будет следовать неверному или бессмысленному плану.

  • Отладка против разработки с нуля: хотя эти модели отлично подходят для написания нового кода «с нуля», они могут испытывать трудности с отладкой или модификацией существующих сложных устаревших систем.

  • Требования к памяти и видеопамяти: Даже «небольшие» модели (например, 9B) требуют значительного объема видеопамяти для высокопроизводительного вывода; «объем памяти» остается высоким, поскольку общее количество параметров по-прежнему занимает пространство графического процессора.

  • Нормативно-правовые аспекты и размещение данных: Использование моделей от китайского поставщика может вызвать вопросы о размещении данных в некоторых юрисдикциях, хотя открытая версия Apache 2.0 позволяет размещать данные в «суверенных» локальных облаках.

Предприятиям следует отдавать приоритет «проверяемым» задачам, таким как программирование, математические вычисления или следование инструкциям, результаты которых могут быть автоматически проверены на соответствие предопределенным правилам, чтобы предотвратить «взлом системы вознаграждения» или скрытые сбои.

Подпишитесь, чтобы получать самые свежие новости!

Подробные аналитические данные для руководителей предприятий в области искусственного интеллекта, данных и безопасности.

VB Daily AI Weekly Еженедельник AGI Еженедельник по безопасности Еженедельник по инфраструктуре данных Мероприятия VB Все они

Отправляя свой адрес электронной почты, вы соглашаетесь с нашими Условиями использования и Политикой конфиденциальности.

Получайте обновления ! Вы подписаны! Наши последние новости скоро поступят на вашу электронную почту.

Источник: venturebeat.com

✅ Найденные теги: Alibaba, gpt-oss-120B, OpenAI, Qwen3.5-9B, Небольшой,, новости, Ноутбуки

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

ideipro logotyp
Шкала скорости на красно-зеленом фоне, со стрелкой, указывающей на желтую зону.
Диаграмма процесса упрощения текстов с автооценкой, уточнением и ранжированием.
ideipro logotyp
Созданный двумя инженерами агент обработки данных на основе искусственного интеллекта от OpenAI уже обслуживает тысячи сотрудников, и, по словам компании, любой может его воспроизвести.
Структурная формула тироксина на фоне с градиентом.
Мужчина в деловом костюме на фоне синих знаков, держит пресс-конференцию.
Карты для покера с зелёными рисунками на фоне других карт.
Пациентка на приеме у врача-отоларинголога в медицинском кабинете.
Image Not Found
ideipro logotyp

Динамическая теория последовательного поиска в сетях Хопфилда, управляемых входными данными.

arXiv:2603.03201v2 Тип объявления: replace-cross Аннотация: Рассуждение — это способность интегрировать внутренние состояния и внешние входные данные в осмысленный и семантически непротиворечивый поток. Современные системы машинного обучения (МО) все чаще полагаются на такое последовательное рассуждение, от понимания языка…

Мар 7, 2026
Шкала скорости на красно-зеленом фоне, со стрелкой, указывающей на желтую зону.

Более эффективный способ для больших языковых моделей анализировать сложные задачи.

Эта новая методика позволяет студентам магистратуры динамически корректировать объем вычислительных ресурсов, используемых для рассуждений, в зависимости от сложности вопроса. Исследователи из MIT разработали более эффективный способ распределения вычислительных ресурсов в логической модели во время решения задачи, что…

Мар 7, 2026
Диаграмма процесса упрощения текстов с автооценкой, уточнением и ранжированием.

Упрощение сложного текста: минимизация потерь при преобразовании текста с помощью Gemini.

Данное исследование демонстрирует потенциал программ обучения на уровне бакалавриата для доступного распространения информации, позволяя экспертным знаниям достигать более широкой аудитории без ущерба для точности. Быстрые ссылки Бумага Делиться Скопировать ссылку × Цифровая эпоха предоставляет все больший доступ…

Мар 7, 2026
ideipro logotyp

Sora 2 уже здесь | OpenAI

Наша новейшая модель генерации видео более физически точна, реалистична и управляема, чем предыдущие системы. Она также включает синхронизированные диалоги и звуковые эффекты. Создавайте с её помощью в новом приложении Sora. Скачайте приложение Sora (откроется в новом окне)…

Мар 7, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых