ElevenLabs под ударом — вышла open source-модель Chatterbox Turbo для клонирования голоса
В open source зарелизили Chatterbox Turbo — компактную и очень быструю модель для генерации и клонирования речи.
По возможностям она напрямую заходит на территорию ElevenLabs — но без закрытых API и платных ограничений.
Что умеет модель:
— Всего 350 млн параметров — запускается даже на простом GPU.
— Генерация речи в 6 раз быстрее многих конкурентов.
— Для клонирования хватает 5 секунд аудио.
— Управление эмоциями через промпт: монотонность, драматичность, смех, вздохи, паузы, чавканье и другие нюансы.
— Поддержка 23 языков, включая русский.
Минимальный размер, высокая скорость и полный контроль над подачей делают Chatterbox Turbo серьёзным ударом по проприетарным TTS-сервисам.
Опенсорс снова пришёл за платными флагманами.



























