✴️ Qwen одурели и за 2 недели релизнули 9 нейронок
Я всё ждал, когда они остановятся, чтобы написать пост, и, кажется, это время пришло. Загибайте пальцы:
Qwen 3 Next 80B-A3B:
Есть как Instruct, так и Reasoning вариант, последняя обгоняет по бенчам Gemini 2.5 Pro.
Qwen3-ASR-Flash:
Молель для распознавания речи с поддержкой русского языка.
Qwen3-TTS-Flash:
Модель для озвучки текста. Обещают ультрареалистичную речь, поддержку 14 голосов и 10 языков, включая русский. Задержка всего 97 мс.
Qwen-Image-Edit-2509:
Теперь можно смешивать изображения. Качество заметно выросло: сохраняет лица, объекты и контекст в идеальном виде. Добавили ControlNet для точного контроля поз персонажей.
Qwen3-Omni:
Мультимодальная нейросеть «всё в одном»: обрабатывает текст, изображения, аудио и видео. Поддерживает 119 языков, обрабатывает аудио до 30 минут с задержкой 211 мс.
Qwen3-Max:
Флагманская Instruct модель с более чем 1 трлн. параметров. Обучена на колоссальном датасете в 36 трлн. токенов. Также в стадии активного обучения находится топовая версии Thinking с функцией пошагового рассуждения.
Qwen3-VL:
Мультимодальная модель, которая понимает изображения и видео. Флагманская версия Qwen3-VL-235B-A22B поддерживает контекст до 256K токенов с возможностью расширения до 1 млн.
Qwen3-Coder:
Флагман генерации кода. В SWE-Bench набрала 69.6%.
Wan 2.5:
О ней уже писали тут.
✋ Пока мы все ждем DeepSeek-v4, Qwen потихоньку захватывает open-source сегмент по всем направлениям и не думает сбавлять темпы.
👋 Lama AI — #лама_news























