
Николас Леонард и Дерек Канеха хотели создать голосовых агентов на основе искусственного интеллекта, но, приступив к разработке продукта, обнаружили, что многие из этих голосовых агентов имеют недостатки в дизайне.
Некоторые из этих агентов создавались с помощью инструментов, не требующих написания кода, что означало быструю разработку и внедрение в производство, но качество продукта часто было низким. Другие агенты создавались компаниями, у которых было время и ресурсы, чтобы потратить месяцы на разработку специализированных инструментов. «Разработчикам и предприятиям нужна была альтернатива», — сказал Леонард в интервью TechCrunch, добавив, что он и Канеха также поняли, что будущее программного обеспечения будет «закодировано, проверено и оптимизировано с помощью агентов, созданных на основе кода».
«Эти два вывода, а также историческое открытие вдохновили нас на создание VoiceRun», — сказал Леонард, генеральный директор компании. Канеха — технический директор компании.
В прошлом году они решили запустить VoiceRun — платформу, которая позволяет разработчикам и помощникам по программированию запускать и масштабировать голосовых агентов. Сейчас многие из этих платформ с низким уровнем кодирования позволяют создавать голосовых агентов с помощью визуальных диаграмм, где пользователи проходят через диалоговые сценарии и вводят подсказки в поля, которые затем определяют, как должен вести себя агент. По словам Леонарда, всем этим сложно управлять.
С другой стороны, VoiceRun позволяет пользователям программировать поведение своих голосовых агентов, предоставляя им большую гибкость при создании желаемого продукта. Код — это родной язык программистов, пояснил Леонард. «Они будут работать гораздо лучше, используя код, чем визуальный интерфейс», — сказал Леонард.
Кроме того, в случае с визуальными элементами возможности настройки ограничены, поэтому, например, если кто-то захочет создать голосового агента, способного говорить на другом диалекте, это может быть сложнее сделать, если разработчик визуального интерфейса не предусмотрел функцию, которая может справиться с этой задачей.
«Но в коде это сделать невероятно просто, — сказал он. — Существует множество примеров мелких действий, которые могут потребоваться, но которые не поддерживаются визуальным интерфейсом».
Помимо создания агентов для программирования, VoiceRun также позволяет пользователям проводить A/B-тестирование и мгновенно развертывать приложение одним щелчком мыши.
Компания ориентирована на корпоративных разработчиков, помогая компаниям, например, внедрять ИИ в свои службы поддержки клиентов или помогать технологическим компаниям запускать продукты на основе голосового управления. Он упомянул, например, работу с компанией, занимающейся ресторанными технологиями, над запуском телефонного консьержа на основе ИИ для бронирования столиков в ресторанах.
В среду компания объявила о завершении посевного раунда финансирования в размере 5,5 миллионов долларов, возглавляемого Flybridge Capital.
В сфере разработки ИИ-агентов существует огромная конкуренция. В прошлом году стартапы в этой области привлекли миллиарды долларов (из многих миллиардов, которые влились в компании, занимающиеся ИИ в целом). Леонард считает, что его компания сталкивается с двумя крайностями рынка: есть конструкторы голосовых команд без необходимости написания кода, такие как Bland и ReTell AI, которые позволяют пользователям быстро создавать демо-версии. Есть также более сложные инструменты, такие как LiveKt и Pipecat, которые предоставляют разработчикам «максимальный контроль». Он считает, что Voicerun находится посередине между этими двумя крайностями.
«Мы предоставляем глобальную голосовую инфраструктуру и жизненный цикл, основанный на оценке, при этом сохраняя за клиентом право собственности на код бизнес-логики и данные», — сказал он. «Ключевое отличие заключается в том, что мы замыкаем цикл разработки агентов кодирования от начала до конца. Мы ожидаем, что разработчики будут контролировать агентов кодирования, которые пишут код, запускают тесты, развертывают и предлагают улучшения».
В некотором смысле Леонард надеется, что его продукт поможет разработчикам создавать инструменты голосового сопровождения, которые, в свою очередь, помогут людям чувствовать себя более комфортно с автоматизированными голосами. Сегодня клиенты «испытывают облегчение», когда на телефонный звонок отвечает человек, «потому что голосовая автоматизация была ненадежной и неэффективной».
Опрос, проведенный компанией Five9 в прошлом году, показал, что три четверти респондентов по-прежнему предпочитают общаться с живыми людьми по вопросам обслуживания клиентов. Леонард сказал, что хочет изменить это восприятие, потому что «у современных операторов есть свои ограничения», такие как языковые барьеры или ощущение осуждения со стороны окружающих.
«До Model T были отличные автомобили, но повсеместное распространение транспортных средств началось только с конвейерной сборки», — сказал Леонард. «Сегодня существуют отличные голосовые агенты, но они не станут повсеместными, пока не будет построена фабрика голосовых агентов. VoiceRun — это и есть эта фабрика».
Источник: techcrunch.com























