Image

Mistral выпустил открытую модель для распознавания речи Voxtral 🗣 Стартап…

Mistral выпустил открытую модель для распознавания речи Voxtral 🗣

Стартап п<a href="https://mistral.ai/news/voxtral»>редставляет Voxtral как полноценную альтернативу закрытым системам — с открытыми весами, высокой точностью работы и существенно меньшей стоимостью. Модель работает на базе Mistral Small 3.1, благодаря этому Voxtral транскрибирует до 30 минут аудио и может отслеживать контекст до 40 минут. Voxtral отвечает на вопросы, создает резюме и относительно быстро выполняет другие команды — от вызова API до запуска функций.

На данный момент пользователям доступно два основных варианта: Voxtral Small (24 млрд параметров) для масштабных развертываний и Voxtral Mini (3 млрд) — для локального и периферийного развертывания. Voxtral Small и Mini способны отвечать на вопросы непосредственно по аудиозаписи либо на основе комбинированного ввода — звука и текстового запроса.

Отдельно выпущена сверхдешевая, упрощенная и быстрая версия API Mini с 3 млрд параметров под названием Voxtral Mini Transcribe, оптимизированная исключительно для перевода аудио в текст.

Внутренний бенчмарк Mistral Audio Understanding п<a href=»https://arxiv.org/html/2507.13264v1″>оказал, что Voxtral Small достигает точности 86,6%, а более компактная Voxtral Mini — 85,6%, по оценке llm_judge_score. Это сопоставимо с показателями Gemini 2.5 Flash (88,6%) и выше, чем у GPT-4o mini Audio (80%).

В дополнение к этому Voxtral Small протестирована на распространенных аудиозадачах, где модель обрабатывает как синтезированную речь, так и комбинированные голосовые и текстовые запросы. В задаче Openbook QA она показала 88,4% точности, в GSM8k — 89,7%, в Trivia QA — 79,4%, на синтезированной версии MMLU — 74,3%, в Llama QA — 71,7%, а в MMAU — 62,2%.

Пользователи могут бесплатно п<a href="https://techcrunch.com/2025/07/15/mistral-releases-voxtral-its-first-open-source-ai-audio-model/»>опробовать Voxtral, воспользовавшись API на Hugging Face или протестировав модели в чат-боте Mistral Le Chat. По данным компании, интеграция API в приложения стоит от $0,001 в минуту.

file 554

Image Not Found
Дизайн по запросу: Anthropic запускает Claude Design Anthropic представили новую…

Дизайн по запросу: Anthropic запускает Claude Design Anthropic представили новую…

Дизайн по запросу: Anthropic запускает Claude Design Anthropic представили новую платформу — Claude Design, где визуалы собираются прямо из текста. Что умеет: — делает дизайны, прототипы, презентации — генерирует слайды и визуальные материалы — работает на модели…

Апр 20, 2026
Tesla собирает авто без руля: Cybercab уже на конвейере Tesla…

Tesla собирает авто без руля: Cybercab уже на конвейере Tesla…

Tesla собирает авто без руля: Cybercab уже на конвейере Tesla начала сборку своего самого радикального проекта — Cybercab. Что показали: — первые экземпляры с гигафабрики в Техасе — полностью автономный формат — без руля и педалей Идея:…

Апр 20, 2026
ИИ вышел из чатов: теперь он двигает экономику Нейросети перестают…

ИИ вышел из чатов: теперь он двигает экономику Нейросети перестают…

ИИ вышел из чатов: теперь он двигает экономику Нейросети перестают быть просто инструментом — они начинают влиять на реальные процессы и деньги. Что уже происходит: — увольнения на фоне внедрения ИИ (Snap) — резкие скачки акций, вплоть…

Апр 20, 2026
Google делает поиск в Windows нормальным: новый ИИ-помощник уже доступен…

Google делает поиск в Windows нормальным: новый ИИ-помощник уже доступен…

Google делает поиск в Windows нормальным: новый ИИ-помощник уже доступен Google выпустил десктопное приложение, которое заменяет стандартный поиск в Windows. Что умеет: — мгновенно находит файлы и приложения — понимает текстовые запросы — ищет по скриншотам —…

Апр 20, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых

ИдеиPRO