
Одним из наиболее эффективных вариантов использования современных моделей искусственного интеллекта стала их способность лучше понимать человеческий голос, что привело к созданию более точных инструментов для диктовки. Один из таких инструментов для Mac, Willow, запускает приложение для iOS, позволяющее пользователям печатать голосом во всех приложениях.
Подобно Wispr Flow, клавиатура Willow транскрибирует ваш голос и форматирует сообщение в соответствии с контекстом. Приложение поддерживает более 100 языков, позволяет вам определять собственную лексику или создавать различные стили письма для различных категорий приложений, таких как работа, обмен сообщениями, электронная почта и других.
Одно из ключевых преимуществ приложения Willow заключается в наличии полноценной клавиатуры для набора текста, в то время как Wispr Flow предлагает только цифровую. Это помогает быстро редактировать слова или предложения, не набирая их вручную. Кроме того, вам не придётся переключаться на другую клавиатуру, если вы хотите набрать текст, а не проговаривать его.

Компанию Willow основали Аллан Го и Лоуренс Лю, выпускники Стэнфорда, но бросили учёбу, чтобы создать стартап. Го пришёл в Y Combinator летом 2024 года с другим составом соучредителей, и изначально их идея была связана со здравоохранением, а именно с разработкой программного обеспечения для управления домами престарелых. Однако идея не прижилась, и в течение года компания пыталась заниматься другими проектами.
«Работая над решениями для здравоохранения, мы заметили, что у врачей есть голосовые ИИ-писцы, которые записывают разговоры с пациентами и создают документы для последующего наблюдения. Я много общался с врачами; они говорили, что эти ИИ-писатели очень полезны для них. Это подтолкнуло нас к созданию голосового ИИ-инструмента для работников сферы интеллектуального труда и других пользователей», — рассказал Го TechCrunch в телефонном разговоре.
Го добавил, что решил не создавать ещё один ИИ-конспектер, поскольку считал рынок насыщенным. Вместо этого, по его мнению, сфера диктовки показалась ему более привлекательной, поскольку большая часть общения происходит вне совещаний. Он отметил, что компания использует ряд моделей и уделяет особое внимание настройке своего конвейера преобразования текста в текст, основанного на моделях Llama от Meta, для форматирования и персонализации.

Затем стартап перенёс запуск YC-пакета на весну 2025 года. Компания заявила, что с момента запуска число пользователей выросло на 50% по сравнению с предыдущим месяцем. Среди корпоративных клиентов, таких как Uber, Heidi Health и Zeg, также есть инструмент для диктовки с такими функциями, как создание собственного командного словаря.
Willow привлекла 4,5 млн долларов от Box Group, Y Combinator, Burst Capital и бизнес-ангелов, среди которых Дхармеш Шах из HubSpot, Томер Лондон из Gusto, соучредитель Reddit Алексис Оганян, бывший главный операционный директор Yelp Кипп Боднар, генеральный директор Opendoor Каз Неджатян, Адам Гилд, соучредитель и генеральный директор компании Owner, занимающейся разработкой программного обеспечения для ресторанов, и соучредитель Instacart Макс Маллен.
Маллен заявил, что, по его мнению, самые удивительные пользовательские интерфейсы будущего будут иметь голосовое управление.
«Меня очень впечатлила идея Аллана не просто создать отличное приложение для диктовки, но и, в долгосрочной перспективе, создать интерфейс, способный управлять компьютером», — сказал он. «Когда я пишу в Willow, мне приходится вносить меньше правок, чем при использовании встроенной системы диктовки компьютера».
Маллен отметил, что одним из его любимых рабочих процессов на настольном компьютере является возможность использования помощника «Hey Willow», чтобы дать команду приложению писать такие вещи, как ответы на электронные письма, вашим собственным голосом.
Стартап конкурирует с другими игроками, такими как Wispr Flow, который на сегодняшний день привлек более 56 миллионов долларов финансирования; Monologue, который является частью пакета подписки Every; и стартапами, поддерживаемыми YC: Aqua, Talktastic, Superwhisper и Betterdication.
Го заявил, что в ближайшие месяцы компания планирует расширить платформу за счет Windows и Android, а также улучшить персонализацию, чтобы сократить количество ручных правок, которые пользователям приходится вносить после диктовки.
Источник: techcrunch.com



























