ideipro logotyp

Microsoft запускает линейку MAI: сразу три модели под продакшен Microsoft…

Microsoft запускает линейку MAI: сразу три модели под продакшен

Microsoft представила семейство MAI — и это не эксперимент, а готовые решения под реальные задачи.

Сразу три направления: речь, голос и изображения.

Что внутри:

MAI-Transcribe-1
— распознавание речи на 25 языках (есть русский)
WER 3,86% — лучше Whisper и Gemini в большинстве языков
— поддержка WAV, MP3, FLAC
— цена: $0,36 за час аудио

MAI-Voice-1
— реалистичный синтез речи с эмоциями
— клонирование голоса (с подтверждением)
— скорость: 1 минута аудио за 1 секунду
— пока только английский
— цена: $22 за 1 млн символов

MAI-Image-2
— генерация изображений (до 1024×1024)
— до 50B параметров
— топ-3 на ArenaAI, сильный фотореализм
— цена: $5 за вход / $33 за выход (1 млн токенов)

Все модели доступны через Microsoft Foundry.

Главный момент — ставка на баланс:
качество + стоимость + готовность к продакшену.

✅ Найденные теги: MAI, Microsoft, Модели, новости, Продакшен

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

ideipro logotyp
3D-изображение прозрачного автомобиля с видимыми внутренними механизмами на фоне чертежей.
Три экрана смартфонов с вопросом о столице Британской Колумбии и вариантами ответов.
Двое мужчин за столом с ноутбуками и микрофонами, фон с логотипом.
Google выпускает Gemma 4 под лицензией Apache 2.0 — и это изменение лицензии может иметь большее значение, чем результаты бенчмарков.
Исследователи анализируют снимки мозга на мониторах в научной лаборатории.
Учёные анализируют снимки мозга на экранах в лаборатории, используя технологии и исследуя образцы.
Два человека обмениваются рукопожатием в офисе, держа папки с документами.
Иллюстрация клетки с большой кнопкой "STOP" внутри, символизирующая остановку процессов.
Image Not Found
Робот сидит с пожилой женщиной на диване, держа её за руки.

Люди сближаются с ИИ быстрее, чем друг с другом —…

Люди сближаются с ИИ быстрее, чем друг с другом — и сами этого не замечают Исследование университетов Фрайбурга и Гейдельберга показало:…

Апр 7, 2026
ideipro logotyp

Упоминание OpenClaw: как разработчики софтвера могут использовать его для своих преимуществ

«Каждой софтверной компании в мире нужна стратегия использования openclaw» — Дженсен Хуанг Иногда мне сложно поверить, что все это…

Апр 7, 2026
Рейтинг производительности ИИ моделей на CanIRun.ai, от B до F.

Удобный ресурс, где можно посмотреть, какая LLM запустится на вашем…

Удобный ресурс, где можно посмотреть, какая LLM запустится на вашем железе локально. Забавно, что при открытии страницы он даже пытается…

Апр 7, 2026
ideipro logotyp

600 языков и ноль цензуры: китайский OmniVoice ломает рынок TTS…

600 языков и ноль цензуры: китайский OmniVoice ломает рынок TTS Появился генератор речи OmniVoice — и он выглядит как серьёзный удар по…

Апр 7, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых