Image

Небольшой, открытый программный продукт Alibaba Qwen3.5-9B превосходит gpt-oss-120B от OpenAI и может работать на стандартных ноутбуках.

Карл Франзен

Маленькая капибара Квен танцует на ноутбуке, а пользователи с восторгом и изумлением наблюдают за ней в стиле каваи (плоская иллюстрация).

Источник: VentureBeat, создано с помощью Google Gemini 3 Pro.

Несмотря на политические потрясения в американском секторе ИИ, в Китае развитие искусственного интеллекта продолжается быстрыми темпами и без каких-либо препятствий.

Сегодня команда исследователей в области искусственного интеллекта Qwen, принадлежащая гиганту электронной коммерции Alibaba и занимающаяся разработкой и выпуском в мир растущего семейства мощных и функциональных моделей искусственного интеллекта с открытым исходным кодом Qwen, представила свою новейшую линейку — серию малых моделей Qwen3.5, в которую входят:

  • Qwen3.5-0.8B и 2B: Две модели, оптимизированные для «миниатюрных» и «быстрых» устройств, предназначенные для прототипирования и развертывания на периферийных устройствах, где время автономной работы имеет первостепенное значение.

  • Qwen3.5-4B: Мощная многомодальная база для легковесных агентов, изначально поддерживающая контекстное окно из 262 144 токенов.

  • Qwen3.5-9B — компактная модель логического мышления, превосходящая по производительности в 13,5 раз более крупный американский конкурент OpenAI gpt-oss-120B по ключевым сторонним тестам, включая многоязычные знания и логическое мышление на уровне аспирантуры.

Чтобы было понятно, эти модели по размерам сопоставимы с самыми маленькими универсальными моделями, выпущенными в последнее время любой лабораторией в мире, и больше похожи на серию LFM2 от LiquidAI (подразделение MIT), которая также содержит несколько сотен миллионов или миллиардов параметров, чем на триллионы параметров (настроек модели), которые, как сообщается, используются для флагманских моделей от OpenAI, Anthropic и серии Gemini от Google.

Весовые коэффициенты для моделей доступны прямо сейчас по всему миру под лицензиями Apache 2.0 — идеально подходящими для корпоративного и коммерческого использования, включая настройку по мере необходимости — на платформах Hugging Face и ModelScope.

Технология: гибридная эффективность и встроенная многомодальность

В основе малой серии Qwen3.5 лежит отход от стандартных архитектур Transformer. Alibaba перешла к эффективной гибридной архитектуре, которая сочетает в себе сети Gated Delta Networks (форма линейного внимания) с разреженными сетями Mixture-of-Experts (MoE).

Этот гибридный подход решает проблему «ограничения памяти», которая обычно сдерживает небольшие модели; благодаря использованию Gated Delta Networks, модели достигают более высокой пропускной способности и значительно меньшей задержки во время вывода.

Кроме того, эти модели изначально являются мультимодальными. В отличие от предыдущих поколений, которые «прикрепляли» кодировщик изображений к текстовой модели, Qwen3.5 обучалась с использованием раннего слияния на мультимодальных токенах. Это позволяет моделям 4B и 9B демонстрировать уровень визуального понимания — например, чтение элементов пользовательского интерфейса или подсчет объектов в видео — который ранее требовал моделей в десять раз большего размера.

Сравнительный анализ «малых» серий: производительность, не поддающаяся масштабированию.

Недавно опубликованные данные сравнительных тестов наглядно демонстрируют, насколько агрессивно эти компактные модели конкурируют с гораздо более крупными отраслевыми стандартами и зачастую превосходят их. Варианты Qwen3.5-9B и Qwen3.5-4B демонстрируют межпоколенческий скачок в эффективности, особенно в задачах, требующих мультимодального мышления и логического вывода.

Тесты серии Qwen3.5 Small Models

Сравнительные тесты серии Qwen3.5 Small Models в сравнении с другими моделями аналогичного размера/класса. Источник: Alibaba Qwen

Превосходство в мультимодальном анализе: в бенчмарке визуального мышления MMMU-Pro Qwen3.5-9B показал результат 70,1, превзойдя Gemini 2.5 Flash-Lite (59,7) и даже специализированный Qwen3-VL-30B-A3B (63,0).

Логика на уровне аспирантуры: В бенчмарке GPQA Diamond модель 9B достигла результата 81,7, превзойдя gpt-oss-120b (80,1), модель, у которой количество параметров более чем в десять раз превышает её показатель.

Понимание видео: Серия демонстрирует выдающиеся результаты в анализе видеоконтента. В тесте Video-MME (с субтитрами) Qwen3.5-9B набрал 84,5 балла, а 4B — 83,5 балла, значительно опередив Gemini 2.5 Flash-Lite (74,6).

Математические достижения: В ходе оценки HMMT в феврале 2025 года (математический турнир Гарвард-Массачусетский технологический институт) модель 9B набрала 83,2 балла, а вариант 4B — 74,0, что доказывает, что для решения сложных задач в области STEM больше не требуются огромные вычислительные кластеры.

Знание документов и многоязычность: Вариант 9B лидирует в распознавании документов в OmniDocBench v1.5 с результатом 87,7. При этом он сохраняет лидирующие позиции по многоязычности в MMMLU с результатом 81,2, превосходя gpt-oss-120b (78,2).

Реакция сообщества: «больше интеллекта, меньше вычислительных ресурсов»

Вслед за выпущенной на прошлой неделе довольно компактной и мощной открытой версией Qwen3.5-Medium, способной работать на одном графическом процессоре, анонс серии Qwen3.5-Small Models с еще меньшими размерами и вычислительными требованиями сразу же вызвал интерес у разработчиков, ориентированных на ИИ с приоритетом локальных вычислений.

Фраза «Больше интеллекта, меньше вычислительных ресурсов» нашла отклик у пользователей, ищущих альтернативы облачным моделям.

Преподаватель в области искусственного интеллекта и технологий Пол Куверт из компании Blueshell AI запечатлел шок отрасли по поводу этого скачка в эффективности.

«Как это вообще возможно?!» — написал Куверт на X. «Компания Qwen выпустила 4 новые модели, и версия 4B почти так же функциональна, как предыдущая 80B A3B. А 9B так же хороша, как GPT OSS 120b, при этом она в 13 раз меньше!»

Анализ Куверта подчеркивает практические последствия этих архитектурных достижений:

  • «Они могут работать на любом ноутбуке»

  • «0,8 млрд и 2 млрд для вашего телефона»

  • «Офлайн и с открытым исходным кодом»

Как сказал разработчик Каран Кендре из Kargul Studio: «Эти модели [могут запускаться] локально на моем MacBook Air с процессором M1 совершенно бесплатно».

Такое ощущение «удивительной» доступности разделяют многие разработчики. Один из пользователей отметил, что модель 4B, служащая «мощной мультимодальной базой», «меняет правила игры для мобильных разработчиков», которым необходимы возможности чтения с экрана без высокой нагрузки на процессор.

Действительно, разработчик Hugging Face, компания Xenova, отметила, что новая серия Qwen3.5 Small Model может даже работать непосредственно в веб-браузере пользователя и выполнять такие сложные и ранее требующие больших вычислительных ресурсов операции, как анализ видео.

Исследователи также высоко оценили выпуск базовых моделей наряду с версиями Instruct, отметив, что это обеспечивает необходимую поддержку для «реальных промышленных инноваций».

Выпуск базовых моделей особенно ценится корпоративными и исследовательскими группами, поскольку он предоставляет «чистый лист», не искаженный определенным набором данных RLHF (обучение с подкреплением на основе обратной связи от человека) или SFT (контролируемая тонкая настройка), которые часто приводят к «отказам» или специфическим стилям общения, которые трудно исправить.

Теперь, с появлением базовых моделей, тем, кто заинтересован в настройке модели под конкретные задачи и цели, стало проще начать, поскольку они могут применять собственные настройки инструкций и постобучение, не отказываясь от готовых решений Alibaba.

Лицензирование: победа для открытой экосистемы

Компания Alibaba опубликовала данные о весе и конфигурационные файлы для серии Qwen3.5 под лицензией Apache 2.0. Эта разрешительная лицензия позволяет использовать, модифицировать и распространять устройства в коммерческих целях без уплаты роялти, устраняя «привязку к поставщику», связанную с проприетарными API.

  • Коммерческое использование: Разработчики могут интегрировать модели в коммерческие продукты без выплаты лицензионных отчислений.

  • Модификация: Команды могут дорабатывать (SFT) или применять RLHF для создания специализированных версий.

  • Распространение: Модели могут быть перераспределены в приложениях ИИ, ориентированных на локальное размещение, таких как Ollama.

Анализ новостей в контексте: почему мелочи так важны сейчас.

Выпуск Qwen3.5 Small Series приходится на момент «перестройки агентских систем». Мы отошли от простых чат-ботов; теперь цель — автономность. Автономный агент должен «думать» (рассуждать), «видеть» (мультимодальность) и «действовать» (использование инструментов). Хотя реализация этого с помощью моделей с триллионами параметров обходится непомерно дорого, локальный Qwen3.5-9B может выполнять эти циклы за гораздо меньшую стоимость.

Благодаря масштабированию обучения с подкреплением (RL) в средах с миллионами агентов, Alibaba наделила эти небольшие модели «человеческим суждением», что позволяет им обрабатывать многоэтапные задачи, такие как организация рабочего стола или обратное проектирование видеозаписей игрового процесса в код. Будь то модель с 0,8 млрд пикселей, работающая на смартфоне, или модель с 9 млрд пикселей, питающая терминал для программирования, серия Qwen3.5 фактически демократизирует «эпоху агентов».

Переход серии Qwen3.5 от «чатбитов» к «собственным мультимодальным агентам» меняет подход предприятий к распределению интеллектуальных ресурсов. Переместив сложные логические вычисления на «периферию» — отдельные устройства и локальные серверы — организации могут автоматизировать задачи, которые ранее требовали дорогостоящих облачных API или обработки с высокой задержкой.

Стратегические аспекты применения и применения на предприятиях

Модели от 0.8B до 9B были модернизированы для повышения эффективности за счет использования гибридной архитектуры, которая активирует только необходимые части сети для каждой задачи.

  • Визуальная автоматизация рабочих процессов: используя «привязку на уровне пикселей», эти модели могут перемещаться по пользовательским интерфейсам настольных или мобильных устройств, заполнять формы и организовывать файлы на основе инструкций на естественном языке.

  • Сложный анализ документов: благодаря результатам, превышающим 90% в тестах на понимание документов, они могут заменить отдельные конвейеры оптического распознавания текста и анализа структуры для извлечения структурированных данных из различных форм и диаграмм.

  • Автономное кодирование и рефакторинг: предприятия могут загружать целые репозитории (до 400 000 строк кода) в контекстное окно размером 1 млн символов для рефакторинга, готового к использованию в производственной среде, или для автоматической отладки.

  • Анализ данных в реальном времени: модели 0.8B и 2B разработаны для мобильных устройств и позволяют создавать видеорезюме в автономном режиме (до 60 секунд при 8 кадрах в секунду) и выполнять пространственное мышление без существенного расхода заряда батареи.

В таблице ниже показано, какие корпоративные функции получат наибольшую выгоду от локального развертывания в небольших масштабах.

Функция

Основное преимущество

Ключевой вариант использования

Программная инженерия

Локальный код интеллекта

Рефакторинг всего репозитория и терминальное агентное программирование.

Операции и ИТ

Безопасная автоматизация

Автоматизация многоэтапных задач настройки системы и управления файлами локально.

Продукт и UX

Взаимодействие на границе

Интеграция встроенных многомодальных систем логического мышления непосредственно в мобильные/настольные приложения.

Данные и аналитика

Эффективная экстракция

Высокоточное оптическое распознавание символов и извлечение структурированных данных из сложных визуальных отчетов.

Несмотря на высокую производительность этих моделей, их малый масштаб и «агентная» природа вводят специфические операционные «сигналы», за которыми команды должны следить.

  • Каскад галлюцинаций: В многоэтапных «агентных» рабочих процессах небольшая ошибка на раннем этапе может привести к «каскаду» сбоев, когда агент будет следовать неверному или бессмысленному плану.

  • Отладка против разработки с нуля: хотя эти модели отлично подходят для написания нового кода «с нуля», они могут испытывать трудности с отладкой или модификацией существующих сложных устаревших систем.

  • Требования к памяти и видеопамяти: Даже «небольшие» модели (например, 9B) требуют значительного объема видеопамяти для высокопроизводительного вывода; «объем памяти» остается высоким, поскольку общее количество параметров по-прежнему занимает пространство графического процессора.

  • Нормативно-правовые аспекты и размещение данных: Использование моделей от китайского поставщика может вызвать вопросы о размещении данных в некоторых юрисдикциях, хотя открытая версия Apache 2.0 позволяет размещать данные в «суверенных» локальных облаках.

Предприятиям следует отдавать приоритет «проверяемым» задачам, таким как программирование, математические вычисления или следование инструкциям, результаты которых могут быть автоматически проверены на соответствие предопределенным правилам, чтобы предотвратить «взлом системы вознаграждения» или скрытые сбои.

Подпишитесь, чтобы получать самые свежие новости!

Подробные аналитические данные для руководителей предприятий в области искусственного интеллекта, данных и безопасности.

VB Daily AI Weekly Еженедельник AGI Еженедельник по безопасности Еженедельник по инфраструктуре данных Мероприятия VB Все они

Отправляя свой адрес электронной почты, вы соглашаетесь с нашими Условиями использования и Политикой конфиденциальности.

Получайте обновления ! Вы подписаны! Наши последние новости скоро поступят на вашу электронную почту.

Источник: venturebeat.com

✅ Найденные теги: Alibaba, gpt-oss-120B, OpenAI, Qwen3.5-9B, Небольшой,, новости, Ноутбуки

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

dummy-img
Деревянные 3D-структуры, разные формы: плоские, изогнутые, оранжевые и синие детали.
Женщина в лаборатории рядом с научным оборудованием.
Химики создали соединения иридия для синтеза «умных» противоопухолевых препаратов
Бариста готовят кофе методом пуровер с помощью медных воронок в кофейне.
Иконки приложений TikTok и Instagram на экране смартфона, уведомление на TikTok.
ideipro logotyp
Искусственный интеллект по вызову: как агентные системы трансформируют передовые методы в здравоохранении
10 репозиториев GitHub для освоения системного проектирования
Image Not Found
dummy-img

ИИ-помощник на кухне: Gambit Robotics

Gambit Robotics — это «умное» кухонное устройство с искусственным интеллектом, которое нужно для помощи в приготовлении блюд: следить за процессом в реальном времени и подсказывать, что делать на каждом этапе готовки.  ИИ-помощник монтируется над плитой и использует…

Мар 6, 2026
Деревянные 3D-структуры, разные формы: плоские, изогнутые, оранжевые и синие детали.

Просто потяните за веревочку, чтобы превратить эти узоры из плиток в полезные трехмерные конструкции.

Вдохновленная японским искусством киригами, команда из Массачусетского технологического института разработала технологию, позволяющую превращать плоские панели в медицинские приборы, жилые модули и другие объекты без использования инструментов. ПРЕДОСТАВЛЕНО ИССЛЕДОВАТЕЛЯМИ Исследователи из Массачусетского технологического института разработали новый метод проектирования…

Мар 6, 2026
Женщина в лаборатории рядом с научным оборудованием.

«Скрытое» состояние впервые использовали для переключения магнитного материала при комнатной температуре

Автор исследования — младший научный сотрудник Анна Кузикова в лаборатории физики ферроиков ФТИ имени А.Ф. Иоффе РАН © Александра Калашникова. Ученые нашли быстрый способ управлять магнитными свойствами материала при комнатной температуре с помощью лазера, чтобы усовершенствовать жесткие…

Мар 6, 2026
Химики создали соединения иридия для синтеза «умных» противоопухолевых препаратов

Химики создали соединения иридия для синтеза «умных» противоопухолевых препаратов

Принцип работы разработанных соединений © Inorganic Chemistry Исследовательская группа химиков Санкт-Петербургского государственного университета с коллегами разработала новое семейство светящихся комплексов иридия, в которых впервые реализован уникальный механизм фотоактивируемого переноса протона. Это открытие в перспективе позволит создавать принципиально…

Мар 6, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых