🎙 Alibaba выпустили CosyVoice 3: опенсорс-монстр для клонирования голоса
Компания Alibaba представила CosyVoice 3 — модель для клонирования голоса, которая открыта для всех и превосходит конкурентов даже при скромных 0,5 млрд параметров.
Ключевые возможности
🌍 Поддерживает 9 языков: русский, английский, китайский, японский, корейский, немецкий, испанский, французский и итальянский.
🔊 Клонирует голос с 3 секунд записи, сохраняя акцент, тембр, ударения и речевые особенности.
🎭 Воспроизводит эмоции и звуки: чавканье, шипение, картавость, всхлипы.
⚡️ Работает почти в реальном времени с задержкой около 150 мс.
✍️ Позволяет вручную корректировать произношение сложных слов.
Почему это важно
Модель с 0,5 млрд параметров конкурирует с более тяжёлыми аналогами, при этом полностью бесплатна и имеет открытую лицензию для коммерческого использования.
Попробовать CosyVoice 3 можно на Hugging Face.
Этот релиз может изменить рынок голосовых технологий, сделав профессиональный синтез и клонирование доступными для всех.
























