Архив рубрики ~Лента новостей~

Speechify добавляет голосовой ввод и голосовой помощник в свое расширение Chrome

Speechify добавляет голосовой ввод и голосовой помощник в свое расширение Chrome
d18e5037cdddc3aa7d356db52882b67f
Источники изображений: Speechify

Speechify — это инструмент, который помогает прослушивать статьи, PDF-файлы и документы. Теперь компания добавляет функции распознавания голоса в своё расширение для Chrome, включая голосовой ввод и голосового помощника, который отвечает на ваши вопросы.

За последние 12 месяцев наблюдается рост числа инструментов распознавания голоса благодаря общему повышению качества моделей распознавания речи. Speechify присоединяется к этому и запускает собственный инструмент для диктовки с поддержкой английского языка. Как и другие инструменты для диктовки, голосовой ввод Speechify исправляет ошибки и удаляет слова-паразиты.

За короткое тестирование, длившееся чуть больше суток, я почувствовал, что инструмент Speechify можно улучшить. Например, он отлично работает с Gmail и Google Docs, но на таких сайтах, как WordPress, у меня возникли трудности с активацией голосовой диктовки и её корректной работой. Компания заявила, что постепенно добавляет оптимизацию для популярных сайтов.

28d26ed4e24935ba9db85eaa2e4bf82f

Что касается точности, частота ошибок в словах оказалась выше, чем у некоторых других инструментов, таких как Wispr Flow, Willow и Monologue. Speechify отметил, что модель обучается быстрее по мере использования, и частота ошибок постепенно снижается.

Стартап также запускает голосовой помощник, который будет встроен в боковую панель браузера. Вы сможете задавать ему вопросы о сайте, например: «Каковы три ключевые идеи?» или «Объясните это проще».

В то время как ChatGPT и Gemini имеют разговорные режимы, Speechify утверждает, что в их приложениях они рассматриваются как нечто второстепенное, а собственный инструмент стартапа ставит голосовые функции на первое место.

«Мы считаем, что чат всегда будет пользовательским интерфейсом по умолчанию в ChatGPT и Gemini при запуске приложений. Именно этого ожидают пользователи. Голосовое управление всегда будет второстепенным, а во многих случаях и вовсе запоздалым для ChatGPT и Gemini. За годы разработки Speechify мы знаем, что значительная часть рынка, включая наших пользователей, хочет, чтобы голосовое управление было основным, стандартным интерфейсом при каждом открытии приложения и общении с ИИ», — сообщил TechCrunch по электронной почте Рохан Павулури, директор по развитию компании.

Заметный недостаток заключается в том, что помощник Speechify в настоящее время не работает с браузерами со встроенными помощниками боковой панели, такими как Atlas от OpenAI, Comet от Perplexity и Dia. Стартап не слишком беспокоится по этому поводу, поскольку расширение в основном предназначено для Chrome и его огромной пользовательской базы.

Компания Speechify заявила, что планирует постепенно включить голосовой ввод и голосового помощника во все свои приложения для настольных компьютеров и мобильных устройств.

Стартап также хочет разработать агентов, которые будут выполнять задачи от вашего имени. Стартап не раскрыл полную дорожную карту, но привёл один пример: совершать звонки, чтобы вы могли записаться на приём или подождать ответа службы поддержки клиентов. Другие компании, такие как Truecaller и Cloacked, также преследуют схожие цели.

Источник: techcrunch.com

Оцените материал:

Поделиться
Понравилась статья? Расскажите другим
ВКонтакте
Читайте также
Архив рубрики ~Обо всем~ [Перевод] Туман живой! Учёные изучили, чем занимаются бактерии, живущие в каплях тумана Архив рубрики ~Обо всем~ 10 признаков того, что кто-то следит за вашими аккаунтами или получает к ним доступ — как это остановить. Новости робототехники Компания Waymo отзывает около 4000 роботакси, чтобы предотвратить их въезд в зоны проведения дорожных работ. Архив рубрики ~Обо всем~ Белки: мозаичный узор, управляющий ими всеми? Архив рубрики ~Обо всем~ Накопитель SanDisk Optimus GX PRO 850P на 8 Тбайт стоит в 4 раза дороже PS5, для которой он создан Новости робототехники Китайская X-Humanoid показала робота TienKung Omni отличающегося от своих конкурентов… Архив рубрики ~Коротко из Telegram~ Code Whale превращает любую модель в кодинг-агента Появился Code Whale… Архив рубрики ~Обо всем~ Передвижной 4K-монитор от Samsung продается со скидкой почти 30% — и его можно использовать как телевизор. Архив рубрики ~Обо всем~ Действительно ли стоит объединять ваши потоковые сервисы в один пакет? Мнение нашего эксперта. Архив рубрики ~Обо всем~ Radeon RX 9070 GRE нашла первых покупателей: её купило более 10 немецких геймеров Новости робототехники Внедрение систем компьютерного зрения способствует повышению производительности в розничной торговле. Архив рубрики ~Обо всем~ Победа Грэма Платнера демонстрирует выигрышную стратегию на промежуточных выборах | Пеппер Калпеппер Архив рубрики ~Коротко из Telegram~ Figma открыли доступ к своей платформе для нейросетей — теперь… Новости робототехники Positive Technologies представила своего первого ИИ-помощника Архив рубрики ~Обо всем~ [Перевод] Туман живой! Учёные изучили, чем занимаются бактерии, живущие в каплях тумана Архив рубрики ~Обо всем~ 10 признаков того, что кто-то следит за вашими аккаунтами или получает к ним доступ — как это остановить. Новости робототехники Компания Waymo отзывает около 4000 роботакси, чтобы предотвратить их въезд в зоны проведения дорожных работ. Архив рубрики ~Обо всем~ Белки: мозаичный узор, управляющий ими всеми? Архив рубрики ~Обо всем~ Накопитель SanDisk Optimus GX PRO 850P на 8 Тбайт стоит в 4 раза дороже PS5, для которой он создан Новости робототехники Китайская X-Humanoid показала робота TienKung Omni отличающегося от своих конкурентов… Архив рубрики ~Коротко из Telegram~ Code Whale превращает любую модель в кодинг-агента Появился Code Whale… Архив рубрики ~Обо всем~ Передвижной 4K-монитор от Samsung продается со скидкой почти 30% — и его можно использовать как телевизор. Архив рубрики ~Обо всем~ Действительно ли стоит объединять ваши потоковые сервисы в один пакет? Мнение нашего эксперта. Архив рубрики ~Обо всем~ Radeon RX 9070 GRE нашла первых покупателей: её купило более 10 немецких геймеров Новости робототехники Внедрение систем компьютерного зрения способствует повышению производительности в розничной торговле. Архив рубрики ~Обо всем~ Победа Грэма Платнера демонстрирует выигрышную стратегию на промежуточных выборах | Пеппер Калпеппер Архив рубрики ~Коротко из Telegram~ Figma открыли доступ к своей платформе для нейросетей — теперь… Новости робототехники Positive Technologies представила своего первого ИИ-помощника