
Компания OpenAI делает большую ставку на аудиоискусственный интеллект, и дело не только в улучшении звучания ChatGPT. Согласно новым сообщениям издания The Information, за последние два месяца компания объединила несколько инженерных, продуктовых и исследовательских групп для модернизации своих аудиомоделей в рамках подготовки к выпуску персонального устройства, ориентированного на аудио, который, как ожидается, появится примерно через год.
Этот шаг отражает направление, в котором движется вся технологическая индустрия — к будущему, где экраны становятся фоновым шумом, а на первый план выходит звук. Умные колонки уже сделали голосовых помощников неотъемлемой частью более чем трети домов в США. Компания Meta недавно представила функцию для своих умных очков Ray-Ban, которая использует массив из пяти микрофонов, чтобы помочь вам слышать разговоры в шумных помещениях — по сути, превращая ваше лицо в направленное устройство для прослушивания. Google, тем временем, в июне начал экспериментировать с «аудиообзорами», которые преобразуют результаты поиска в краткие описания разговоров. А Tesla интегрирует Grok и другие LLM-технологии в свои автомобили для создания разговорных голосовых помощников, которые могут обрабатывать все, от навигации до управления климатом, посредством естественного диалога.
Не только технологические гиганты делают эту ставку. Множество стартапов разделяют эту же убежденность, хотя и с разной степенью успеха. Создатели Humane AI Pin потратили сотни миллионов, прежде чем их носимое устройство без экрана стало поучительной историей. Кулон Friend AI, ожерелье, которое записывает вашу жизнь и предлагает общение, вызвал как опасения по поводу конфиденциальности, так и экзистенциальную тревогу. И теперь, по меньшей мере, две компании, включая Sandbar и компанию, возглавляемую основателем Pebble Эриком Мигиковски, разрабатывают кольца с искусственным интеллектом, дебют которых ожидается в 2026 году, позволяющие владельцам буквально разговаривать с рукой.
Форм-факторы могут различаться, но суть остается той же: аудио — это интерфейс будущего. Каждое пространство — ваш дом, ваша машина, даже ваше лицо — становится интерфейсом.
Новая аудиомодель OpenAI, выход которой запланирован на начало 2026 года, по сообщениям, будет звучать более естественно, обрабатывать прерывания, как настоящий собеседник, и даже говорить во время разговора, чего не могут сделать современные модели. Также сообщается, что компания планирует создать семейство устройств, возможно, включая очки или умные колонки без экрана, которые будут действовать не столько как инструменты, сколько как компаньоны.
Как отмечает издание The Information, бывший руководитель отдела дизайна Apple Джони Айв, который присоединился к разработке аппаратного обеспечения OpenAI после приобретения его фирмы io за 6,5 миллиарда долларов в мае, сделал приоритетом снижение зависимости от гаджетов, рассматривая дизайн, ориентированный на звук, как возможность «исправить ошибки» прошлых потребительских гаджетов.
Источник: techcrunch.com



























