Закажи экспресс-аудит своего дела онлайн всего за 199 ₽
и получи рекомендации по улучшению - Жми сюда !

Наш синтез для экранных читалок (SAPI5) для 20 языков России стал лучше

Ультанул башем в 2012 году
Ультанул башем в 2012 году

Мы не так давно опубликовали SAPI5-обёртку для нашего синтеза на 20 языков России и СНГ. В этот раз опять немного сошлись звёзды и мы уже публикуем улучшение наших читалок. Чтобы не растекаться мыслью по древу и не повторяться, вот краткий список улучшений (полную подводку можно прочитать в прошлой статье):

  • Добавлена рудиментарная читалка чисел и английских букв на русском языке;

  • Теперь есть два инсталлятора, один на базе v5_5_ru(голоса Силеро), другой — на базе v5_cis_base_nostress(голоса России и СНГ). Суммарно поддерживаются все те же 20 языков (включая русский);

  • Скорость (в идеальных условиях) остаётся в районе x100 реального времени для обеих моделей;

  • Модель теперь умеет сама ставить ударения на трёх языках: русском, белорусском и украинском;

  • Для русского языка также добавлена возможность автоматически решать омографы;

  • Славянские языки работают на базе модели, которая обязательно требует ударения. В прочих ударениях модель «сама» ставит ударения;

  • Некоторое количество баг-фиксов: небольшие фиксы по запросам пользователей, фикс отзывчивости моделей и «фризов», фикс артефактов при использовании ускорения и высоты голоса;

  • Также добавлен трекинг по словам для удобства пользования;

  • Добавлен конфигуратор для ударений (включать-выключать ударения и омографы).

Поддержка вопросов (и готовящаяся) поддержка эмфаз пока не доехала в SAPI5, но в целом тут неясен интерфейс для этого добра.

Повторимся, что наш синтез настолько быстрый, что его можно использовать как локальный синтез в Windows на CPU, так и как экранную читалку. И да, вы верно всё поняли. Из коробки будет работать с Балаболкой и другими подобными программами (и не требует видеокарту) на «калькуляторах».

Будем признательны вам за обратную связь и комментарии!

Конфигуратор

После установки программа предложит вам создать ярлык и раздел в меню «Пуск» для конфигуратора:

56351a00426b401ce24f92e206d9fc1b

Его можно использовать без перезапуска приложений, в которых используется читалка. Полное разделение флагов (ставить или не ставить букву ё, ставить или не ставить односложные слова) — для простоты завозить сюда не стали.

Также напомним, что управлять ударением можно и вручную постановкой плюсика перед нужной гласной.

55213708e7911fa3d295c0c7ff62c837

Как скачать

С прошлого раза многократно усилились различные блокировки всего, чего только можно. Поэтому мы даём два способа скачать читалки:

Модель

🔗 Прямая ссылка

🌏 Ссылка на GitHub

v5_5_ru

Ссылка

Ссылка

v5_cis_base_nostress

Ссылка

Ссылка

Установка:

  • Cкачать .exe файл, установить, настроить конфигуратор;

  • Установить программу для озвучки текста, которая работает с SAPI5-интерфейсом. Я тестировал на Балаболке, но у вас может быть своя любимая.

Системные требования:

  • 64-битная Windows;

  • Мы тестировали на Windows 10 и Windows 11;

  • Windows XP скорее всего не будет работать, Windows 7 не тестировали.

Будем признательны вам за обратную связь, по сути это пробный релиз для сбора граблей. Обратите внимание, что языки в принципе можно смешивать и что один и тот же диктор присутствует по два раза — как бы на русском и на своём родном языке (у части дикторов русский тоже родной, или более родной, там зависит от человека).

Дисклеймер

В инсталляторе присутствуют реквизиты для добровольных донатов разработчику SAPI5-интерфейса. Если вам очень сильно поможет читалка — вы можете поддержать его напрямую. Обращаю также внимание, что человек не в последнюю очередь старался и для себя, т.к. является незрячим.

Ссылки

  • Первый релиз читалок — https://habr.com/ru/articles/981992/;

  • Программа Балаболка — https://www.cross-plus-a.com/ru/balabolka.html;

  • Наши модели для простановки ударений — https://github.com/snakers4/silero-stress;

  • Наши модели синтеза — https://github.com/snakers4/silero-models;

  • Новые модели опубликованные в рамках проекта — https://github.com/snakers4/silero-models?tab=readme-ov-file#v5-cis-base-models;

  • Примеры запуска моделей для языков России и СНГ;

  • Обновление проекта silero-stress.

Источник: habr.com

✅ Найденные теги: Sapi5, Наш, новости, Синтез, Читалок, Экранных

Добавить комментарий

Новости других рубрик

Архив рубрики ~Лента новостей~: Использование ИИ приводит к резкому росту неудовлетворительных оценок и снижению уровня математических навыков на занятиях по информатике в Беркли. Архив рубрики ~Лента новостей~: Программа-вымогатель WantToCry удаленно шифрует файлы. Архив рубрики ~Лента новостей~: Что означает эра агентных технологий для науки о данных Архив рубрики ~Лента новостей~: Наблюдательный совет Meta заявляет, что блокировка аккаунтов происходит без соблюдения надлежащей процедуры и прозрачности. Архив рубрики ~Лента новостей~: Национальный научный фонд возобновляет поддержку возглавляемого Массачусетским технологическим институтом института искусственного интеллекта и физики, расширяя новую модель научных открытий. Архив рубрики ~Лента новостей~: Scout от Microsoft — это агентский автопилот, работающий во всей сети Microsoft 365. Архив рубрики ~Лента новостей~: Британским медиа-сайтам предоставлено право блокировать использование Google их статей в поиске с помощью искусственного интеллекта. Архив рубрики ~Лента новостей~: Мюоний в картинках