OpenAI открыла исходники голосового компонента для приложений на gpt-realtime-1.5 OpenAI…
OpenAI открыла исходники голосового компонента для приложений на gpt-realtime-1.5
OpenAI опубликовала на GitHub открытый React-компонент под названием realtime-voice-component. Это готовая основа для разработчиков, которые хотят добавить голосовое управление в свои приложения на базе модели gpt-realtime-1.5.
Вместо того чтобы пользователь кликал по кнопкам и заполнял формы, он просто говорит голосом и управляет состоянием приложения через речь. Компонент берет на себя всю работу с микрофоном, подключением к API и обработкой аудиопотока.
Сама модель gpt-realtime-1.5 вышла в феврале этого года. По сравнению с предыдущей версией: точность распознавания буквенно-цифровых последовательностей выросла на 10%, следование инструкциям улучшилось на 7%, вызов инструментов стал надежнее.
Цена осталась прежней: 32 доллара за миллион аудио-токенов на входе и 64 на выходе.
Оцените материал:
Похожие записи
Perplexity AI запустила Secure Intelligence Institute под руководством Ninghui Li….
04.04.2026
🎬 LTX Studio: Генерируем видео по звуку LTX и ElevenLabs…
27.01.2026
Китайский бум игрушек с искусственным интеллектом В Китае работает уже…
25.10.2025Присоединяйтесь и подпишитесь на рассылку самых свежих новостей по Email
Получайте свежие новости и идеи на почту. Без спама — только самое интересное.
Нажимая «Подписаться», вы соглашаетесь с политикой конфиденциальности.
