Компания, стоящая за TikTok, выпускает помощника с искусственным интеллектом для смартфонов, который ведет себя не как приложение, а скорее как секретарь

Присоединяйтесь к нашему сообществу любителей науки!
Подпишитесь на нашу бесплатную ежедневную рассылку новостейВведите свой адрес электронной почтыЯ соглашаюсь с тем, что моя информация будет обрабатываться в соответствии с Политикой конфиденциальности Scientific American и Springer Nature Limited. Мы используем сторонние сервисы как для проверки, так и для доставки электронной почты. Предоставляя свой адрес электронной почты, вы также даете согласие на передачу этого адреса третьим лицам для этих целей.Зарегистрируйтесь
Китайский технологический гигант ByteDance в понедельник запустил голосовой ассистент с искусственным интеллектом для смартфонов, который может действовать автономно от имени пользователя.
Ассистент, работающий на основе модели Doubao large language от ByteDance, напоминает искусственный интеллект в центре фильма., в котором главный герой влюбляется в голос в своем телефоне.
Искусственный интеллект может открывать вкладки, бронировать билеты и выполнять поиск информации в телефоне. Это будет доступно на смартфоне M153 Nubia, хотя и в ограниченном количестве. По данным китайской финансовой платформы Eastmoney, ByteDance планирует лицензировать этот инструмент для других китайских производителей смартфонов.
О поддержке научной журналистики
Если вам понравилась эта статья, подумайте о том, чтобы поддержать нашу журналистику, отмеченную наградами, подписавшись на нее. Приобретая подписку, вы помогаете обеспечить будущее впечатляющих историй об открытиях и идеях, формирующих наш современный мир.
Doubao LLM — самый популярный чат-бот с искусственным интеллектом в Китае. Установленная на телефоне, она работает на уровне операционной системы, позволяя ИИ видеть, что происходит на экране, и использовать приложения, выполняя такие задачи, как извлечение и упорядочивание файлов, заполнение формуляров и даже предлагая рестораны, соответствующие бюджету и предпочтениям.
Ассистент также обладает памятью, что позволяет ему сохранять информацию на устройстве — заметки о встречах, адреса, возраст и предпочтения ребенка — и превращать их в напоминания или другие данные. список дел, которые нужно сделать. Пользователи могут задавать такие вопросы, как «На каком месте я сидел в поезде на прошлой неделе?» или «Где было то кафе, которое мне понравилось, рядом с офисом?»
Это шаг вперед по сравнению со старыми голосовыми помощниками, такими как Siri от Apple, которые работают таким образом, что ответы могут запаздывать и лишаться эмоциональных нюансов. В этих системах речь записывается, преобразуется в текст, отправляется на сервер для анализа, а затем ответ зачитывается вслух с помощью отдельного инструмента преобразования текста в речь. Искусственный интеллект ByteDance, напротив, использует систему преобразования речи, которая позволяет быстрее отвечать и даже прерывать помощника на полуслове — примерно так же, как вы могли бы прервать друга или коллегу по работе.
Согласно Guangdong Yangcheng Evening News, обновленные голосовые вызовы Doubao практически «неотличимы от голосовых вызовов человека и машины», когда речь заходит о реализме и эмоциях, таких как радость и грусть. Тем не менее, ByteDance предупредила, что технология все еще находится в стадии бета-тестирования и требует дальнейшего тестирования, прежде чем она будет распространена более широко.
Является ли это ее последним достижением в области технологий и научной фантастики энтузиасты, которых вы так долго ждали? В Сан-Франциско, Пекине, Сеуле и Купертино инженеры преследуют одну и ту же цель: создать помощника с искусственным интеллектом, который будет слушать, понимать и действовать, не заставляя вас думать о программном обеспечении в промежутках. Телефонный ассистент Doubao от ByteDance показывает, как быстро приближается это будущее.
Аналогичная технология существует в американском OpenAI GPT‑4o, представленном в 2024 году, который также поддерживает разговоры в режиме реального времени, а Google Gemini Live Mode также может поддерживать общение в режиме реального времени.длительные, прерываемые голосовые чаты на телефонах. А приложения-помощники с искусственным интеллектом все лучше справляются с такими задачами, как подведение итогов звонков и электронных писем, перевод, бронирование встреч и составление ответов. Но основное различие между этими функциями и Doubao заключается в том, что это искусственный интеллект китайского производства, полностью встроенный в смартфон китайского производства, специально предназначенный для китайского рынка.























