OpenAI открыла исходники голосового компонента для приложений на gpt-realtime-1.5 OpenAI…
OpenAI открыла исходники голосового компонента для приложений на gpt-realtime-1.5
OpenAI опубликовала на GitHub открытый React-компонент под названием realtime-voice-component. Это готовая основа для разработчиков, которые хотят добавить голосовое управление в свои приложения на базе модели gpt-realtime-1.5.
Вместо того чтобы пользователь кликал по кнопкам и заполнял формы, он просто говорит голосом и управляет состоянием приложения через речь. Компонент берет на себя всю работу с микрофоном, подключением к API и обработкой аудиопотока.
Сама модель gpt-realtime-1.5 вышла в феврале этого года. По сравнению с предыдущей версией: точность распознавания буквенно-цифровых последовательностей выросла на 10%, следование инструкциям улучшилось на 7%, вызов инструментов стал надежнее.
Цена осталась прежней: 32 доллара за миллион аудио-токенов на входе и 64 на выходе.

Добавить комментарий
Для отправки комментария вам необходимо авторизоваться.