Наш синтез для экранных читалок (SAPI5) для 20 языков России стал лучше

Мы не так давно опубликовали SAPI5-обёртку для нашего синтеза на 20 языков России и СНГ. В этот раз опять немного сошлись звёзды и мы уже публикуем улучшение наших читалок. Чтобы не растекаться мыслью по древу и не повторяться, вот краткий список улучшений (полную подводку можно прочитать в прошлой статье):
-
Добавлена рудиментарная читалка чисел и английских букв на русском языке;
-
Теперь есть два инсталлятора, один на базе v5_5_ru(голоса Силеро), другой — на базе v5_cis_base_nostress(голоса России и СНГ). Суммарно поддерживаются все те же 20 языков (включая русский);
-
Скорость (в идеальных условиях) остаётся в районе x100 реального времени для обеих моделей;
-
Модель теперь умеет сама ставить ударения на трёх языках: русском, белорусском и украинском;
-
Для русского языка также добавлена возможность автоматически решать омографы;
-
Славянские языки работают на базе модели, которая обязательно требует ударения. В прочих ударениях модель «сама» ставит ударения;
-
Некоторое количество баг-фиксов: небольшие фиксы по запросам пользователей, фикс отзывчивости моделей и «фризов», фикс артефактов при использовании ускорения и высоты голоса;
-
Также добавлен трекинг по словам для удобства пользования;
-
Добавлен конфигуратор для ударений (включать-выключать ударения и омографы).
Поддержка вопросов (и готовящаяся) поддержка эмфаз пока не доехала в SAPI5, но в целом тут неясен интерфейс для этого добра.
Повторимся, что наш синтез настолько быстрый, что его можно использовать как локальный синтез в Windows на CPU, так и как экранную читалку. И да, вы верно всё поняли. Из коробки будет работать с Балаболкой и другими подобными программами (и не требует видеокарту) на «калькуляторах».
Будем признательны вам за обратную связь и комментарии!
Конфигуратор
После установки программа предложит вам создать ярлык и раздел в меню «Пуск» для конфигуратора:

Его можно использовать без перезапуска приложений, в которых используется читалка. Полное разделение флагов (ставить или не ставить букву ё, ставить или не ставить односложные слова) — для простоты завозить сюда не стали.
Также напомним, что управлять ударением можно и вручную постановкой плюсика перед нужной гласной.

Как скачать
С прошлого раза многократно усилились различные блокировки всего, чего только можно. Поэтому мы даём два способа скачать читалки:
|
Модель |
🔗 Прямая ссылка |
🌏 Ссылка на GitHub |
|
v5_5_ru |
Ссылка |
Ссылка |
|
v5_cis_base_nostress |
Ссылка |
Ссылка |
Установка:
-
Cкачать .exe файл, установить, настроить конфигуратор;
-
Установить программу для озвучки текста, которая работает с SAPI5-интерфейсом. Я тестировал на Балаболке, но у вас может быть своя любимая.
Системные требования:
-
64-битная Windows;
-
Мы тестировали на Windows 10 и Windows 11;
-
Windows XP скорее всего не будет работать, Windows 7 не тестировали.
Будем признательны вам за обратную связь, по сути это пробный релиз для сбора граблей. Обратите внимание, что языки в принципе можно смешивать и что один и тот же диктор присутствует по два раза — как бы на русском и на своём родном языке (у части дикторов русский тоже родной, или более родной, там зависит от человека).
Дисклеймер
В инсталляторе присутствуют реквизиты для добровольных донатов разработчику SAPI5-интерфейса. Если вам очень сильно поможет читалка — вы можете поддержать его напрямую. Обращаю также внимание, что человек не в последнюю очередь старался и для себя, т.к. является незрячим.
Ссылки
-
Первый релиз читалок — https://habr.com/ru/articles/981992/;
-
Программа Балаболка — https://www.cross-plus-a.com/ru/balabolka.html;
-
Наши модели для простановки ударений — https://github.com/snakers4/silero-stress;
-
Наши модели синтеза — https://github.com/snakers4/silero-models;
-
Новые модели опубликованные в рамках проекта — https://github.com/snakers4/silero-models?tab=readme-ov-file#v5-cis-base-models;
-
Примеры запуска моделей для языков России и СНГ;
-
Обновление проекта silero-stress.
Источник: habr.com

Добавить комментарий
Для отправки комментария вам необходимо авторизоваться.