Представление CosyVoice3 — многоязычной модели синтеза речи с открытым исходным кодом.

🎙 Alibaba выпустили CosyVoice 3: опенсорс-монстр для клонирования голоса Компания…

🎙 Alibaba выпустили CosyVoice 3: опенсорс-монстр для клонирования голоса

Компания Alibaba представила CosyVoice 3 — модель для клонирования голоса, которая открыта для всех и превосходит конкурентов даже при скромных 0,5 млрд параметров.

Ключевые возможности
🌍 Поддерживает 9 языков: русский, английский, китайский, японский, корейский, немецкий, испанский, французский и итальянский.
🔊 Клонирует голос с 3 секунд записи, сохраняя акцент, тембр, ударения и речевые особенности.
🎭 Воспроизводит эмоции и звуки: чавканье, шипение, картавость, всхлипы.
⚡️ Работает почти в реальном времени с задержкой около 150 мс.
✍️ Позволяет вручную корректировать произношение сложных слов.

Почему это важно
Мод
ель с 0,5 млрд параметров конкурирует с более тяжёлыми аналогами, при этом полностью бесплатна и имеет открытую лицензию для коммерческого использования.

Попробовать CosyVoice 3 можно на Hugging Face.

Этот релиз может изменить рынок голосовых технологий, сделав профессиональный синтез и клонирование доступными для всех.

Представление CosyVoice3 — многоязычной модели синтеза речи с открытым исходным кодом.
✅ Найденные теги: Alibaba, CosyVoice, Голос, здоровье, Клонирование, новости, опенсорс

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Скриншот с переводом текста про местоположение Марса в Солнечной системе.
Apple использует Gemini с Siri для ответов, похожих на ChatGPT.
Экранышот YouTube с видео о начале работы с Codex от OpenAI в интерфейсе VS Code.
Компактный фотопринтер печатает яркое фото с изображением группы людей.
Рабочий стол компьютера с множеством файлов и папок и открытой программой на переднем плане.
Женщина паркуристка прыгает между небоскрёбами в футуристическом городе на закате.
Умная кормушка с камерой в саду и птичка на краю.
Цифровой чек на покупку кексов с творожным кремом на 500 рублей с QR-кодом.
ideipro logotyp
Image Not Found
Скриншот с переводом текста про местоположение Марса в Солнечной системе.

OpenAI запустила собственный переводчик OpenAI представила встроенный переводчик на базе…

OpenAI запустила собственный переводчик OpenAI представила встроенный переводчик на базе ChatGPT. Сервис обещает быстрый и сверхточный перевод с учётом контекста, стиля и нюансов языка. Фактически это шаг к конкуренции с классическими переводчиками — но с упором на…

Янв 16, 2026
Apple использует Gemini с Siri для ответов, похожих на ChatGPT.

Siri станет «добрее»: Apple внедряет Gemini Журналисты выяснили, что Apple…

Siri станет «добрее»: Apple внедряет Gemini Журналисты выяснили, что Apple интегрирует функции Gemini в экосистему Apple — в том числе в Siri. Что изменится: — Siri начнёт хвалить пользователя и давать эмоциональную поддержку — станет сильнее в…

Янв 16, 2026
Экранышот YouTube с видео о начале работы с Codex от OpenAI в интерфейсе VS Code.

OpenAI выпустили большой гайд по работе с Codex — подробно…

OpenAI выпустили большой гайд по работе с Codex — подробно показывают, как встроить ИИ-агента в реальные рабочие процессы и делегировать ему часть задач. В видео от OpenAI: — установка и настройка Codex в терминале и VS Code…

Янв 16, 2026
Женщина паркуристка прыгает между небоскрёбами в футуристическом городе на закате.

На Forbes вышел интересный материал, в котором прогнозируется, как агентный…

На Forbes вышел интересный материал, в котором прогнозируется, как агентный ИИ в 2026 году изменит работу, бизнес‑модели и инфраструктуру,…

Янв 15, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых