
Speechify — это инструмент, который помогает прослушивать статьи, PDF-файлы и документы. Теперь компания добавляет функции распознавания голоса в своё расширение для Chrome, включая голосовой ввод и голосового помощника, который отвечает на ваши вопросы.
За последние 12 месяцев наблюдается рост числа инструментов распознавания голоса благодаря общему повышению качества моделей распознавания речи. Speechify присоединяется к этому и запускает собственный инструмент для диктовки с поддержкой английского языка. Как и другие инструменты для диктовки, голосовой ввод Speechify исправляет ошибки и удаляет слова-паразиты.
За короткое тестирование, длившееся чуть больше суток, я почувствовал, что инструмент Speechify можно улучшить. Например, он отлично работает с Gmail и Google Docs, но на таких сайтах, как WordPress, у меня возникли трудности с активацией голосовой диктовки и её корректной работой. Компания заявила, что постепенно добавляет оптимизацию для популярных сайтов.

Что касается точности, частота ошибок в словах оказалась выше, чем у некоторых других инструментов, таких как Wispr Flow, Willow и Monologue. Speechify отметил, что модель обучается быстрее по мере использования, и частота ошибок постепенно снижается.
Стартап также запускает голосовой помощник, который будет встроен в боковую панель браузера. Вы сможете задавать ему вопросы о сайте, например: «Каковы три ключевые идеи?» или «Объясните это проще».
В то время как ChatGPT и Gemini имеют разговорные режимы, Speechify утверждает, что в их приложениях они рассматриваются как нечто второстепенное, а собственный инструмент стартапа ставит голосовые функции на первое место.
«Мы считаем, что чат всегда будет пользовательским интерфейсом по умолчанию в ChatGPT и Gemini при запуске приложений. Именно этого ожидают пользователи. Голосовое управление всегда будет второстепенным, а во многих случаях и вовсе запоздалым для ChatGPT и Gemini. За годы разработки Speechify мы знаем, что значительная часть рынка, включая наших пользователей, хочет, чтобы голосовое управление было основным, стандартным интерфейсом при каждом открытии приложения и общении с ИИ», — сообщил TechCrunch по электронной почте Рохан Павулури, директор по развитию компании.
Заметный недостаток заключается в том, что помощник Speechify в настоящее время не работает с браузерами со встроенными помощниками боковой панели, такими как Atlas от OpenAI, Comet от Perplexity и Dia. Стартап не слишком беспокоится по этому поводу, поскольку расширение в основном предназначено для Chrome и его огромной пользовательской базы.
Компания Speechify заявила, что планирует постепенно включить голосовой ввод и голосового помощника во все свои приложения для настольных компьютеров и мобильных устройств.
Стартап также хочет разработать агентов, которые будут выполнять задачи от вашего имени. Стартап не раскрыл полную дорожную карту, но привёл один пример: совершать звонки, чтобы вы могли записаться на приём или подождать ответа службы поддержки клиентов. Другие компании, такие как Truecaller и Cloacked, также преследуют схожие цели.
Источник: techcrunch.com





















