Image

Возможно, Настал Момент, Когда Она Заговорила По Телефону — Она Говорит По-Китайски

Компания, стоящая за TikTok, выпускает помощника с искусственным интеллектом для смартфонов, который ведет себя не как приложение, а скорее как секретарь

26 июня 2024 года на стенде Nubia Global на выставке SNIEC в Шанхае, Китай, во время открытия Всемирного конгресса мобильных устройств (MWC) 2024.

Присоединяйтесь к нашему сообществу любителей науки!

Подпишитесь на нашу бесплатную ежедневную рассылку новостейВведите свой адрес электронной почтыЯ соглашаюсь с тем, что моя информация будет обрабатываться в соответствии с Политикой конфиденциальности Scientific American и Springer Nature Limited. Мы используем сторонние сервисы как для проверки, так и для доставки электронной почты. Предоставляя свой адрес электронной почты, вы также даете согласие на передачу этого адреса третьим лицам для этих целей.Зарегистрируйтесь

Китайский технологический гигант ByteDance в понедельник запустил голосовой ассистент с искусственным интеллектом для смартфонов, который может действовать автономно от имени пользователя.

Ассистент, работающий на основе модели Doubao large language от ByteDance, напоминает искусственный интеллект в центре фильма., в котором главный герой влюбляется в голос в своем телефоне.

Искусственный интеллект может открывать вкладки, бронировать билеты и выполнять поиск информации в телефоне. Это будет доступно на смартфоне M153 Nubia, хотя и в ограниченном количестве. По данным китайской финансовой платформы Eastmoney, ByteDance планирует лицензировать этот инструмент для других китайских производителей смартфонов.

О поддержке научной журналистики

Если вам понравилась эта статья, подумайте о том, чтобы поддержать нашу журналистику, отмеченную наградами, подписавшись на нее. Приобретая подписку, вы помогаете обеспечить будущее впечатляющих историй об открытиях и идеях, формирующих наш современный мир.

Doubao LLM — самый популярный чат-бот с искусственным интеллектом в Китае. Установленная на телефоне, она работает на уровне операционной системы, позволяя ИИ видеть, что происходит на экране, и использовать приложения, выполняя такие задачи, как извлечение и упорядочивание файлов, заполнение формуляров и даже предлагая рестораны, соответствующие бюджету и предпочтениям.

Ассистент также обладает памятью, что позволяет ему сохранять информацию на устройстве — заметки о встречах, адреса, возраст и предпочтения ребенка — и превращать их в напоминания или другие данные. список дел, которые нужно сделать. Пользователи могут задавать такие вопросы, как «На каком месте я сидел в поезде на прошлой неделе?» или «Где было то кафе, которое мне понравилось, рядом с офисом?»

Это шаг вперед по сравнению со старыми голосовыми помощниками, такими как Siri от Apple, которые работают таким образом, что ответы могут запаздывать и лишаться эмоциональных нюансов. В этих системах речь записывается, преобразуется в текст, отправляется на сервер для анализа, а затем ответ зачитывается вслух с помощью отдельного инструмента преобразования текста в речь. Искусственный интеллект ByteDance, напротив, использует систему преобразования речи, которая позволяет быстрее отвечать и даже прерывать помощника на полуслове — примерно так же, как вы могли бы прервать друга или коллегу по работе.

Согласно Guangdong Yangcheng Evening News, обновленные голосовые вызовы Doubao практически «неотличимы от голосовых вызовов человека и машины», когда речь заходит о реализме и эмоциях, таких как радость и грусть. Тем не менее, ByteDance предупредила, что технология все еще находится в стадии бета-тестирования и требует дальнейшего тестирования, прежде чем она будет распространена более широко.

Является ли это ее последним достижением в области технологий и научной фантастики энтузиасты, которых вы так долго ждали? В Сан-Франциско, Пекине, Сеуле и Купертино инженеры преследуют одну и ту же цель: создать помощника с искусственным интеллектом, который будет слушать, понимать и действовать, не заставляя вас думать о программном обеспечении в промежутках. Телефонный ассистент Doubao от ByteDance показывает, как быстро приближается это будущее.

Аналогичная технология существует в американском OpenAI GPT‑4o, представленном в 2024 году, который также поддерживает разговоры в режиме реального времени, а Google Gemini Live Mode также может поддерживать общение в режиме реального времени.длительные, прерываемые голосовые чаты на телефонах. А приложения-помощники с искусственным интеллектом все лучше справляются с такими задачами, как подведение итогов звонков и электронных писем, перевод, бронирование встреч и составление ответов. Но основное различие между этими функциями и Doubao заключается в том, что это искусственный интеллект китайского производства, полностью встроенный в смартфон китайского производства, специально предназначенный для китайского рынка.

✅ Найденные теги: Возможно,, новости

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Цветные блоки и линии, символизирующие технологическую сеть или блокчейн.
ideipro logotyp
Текст "MIT 2025 in the Media" на фоне цифровой сетки и световых эффектов.
Диаграмма Венна: пересечение U-REGLE, M-REGLE и GWAS Catalog.
Извлечение документов DPT-2, точность 99.16%, DocVQA, текст под подписью.
Новая открытая система «автоисследований» Андрея Карпати позволяет запускать сотни экспериментов с искусственным интеллектом за ночь, что имеет революционные последствия.
Новорожденный в инкубаторе с фототерапией под синим светом.
Паркетный зал с деловой встречей, люди сидят и слушают спикеров за столом.
Детский рисунок: робот и слова на английском с объектами, включая кролика и гитару.
Image Not Found
Цветные блоки и линии, символизирующие технологическую сеть или блокчейн.

Создание надежной инфраструктуры данных для успешной работы агентов искусственного интеллекта.

В сотрудничестве с SAP В гонке за внедрением и демонстрацией преимуществ ИИ предприятия как никогда быстро развертывают агентные системы ИИ в качестве помощников, ассистентов и автономных исполнителей задач. Согласно ежегодному отчету McKinsey об ИИ, к концу 2025…

Мар 14, 2026
ideipro logotyp

Увеличение длины последовательности — это ещё не всё: эффективная интеграция мультимодальных сигналов для прогнозирования экспрессии генов.

arXiv:2602.21550v2 Тип объявления: замена-кросс Аннотация: Прогнозирование экспрессии генов, то есть предсказание уровней экспрессии мРНК на основе последовательностей ДНК, представляет собой серьезную проблему. Предыдущие работы часто фокусировались на увеличении длины входной последовательности для определения дистальных энхансеров, которые могут…

Мар 14, 2026
Текст "MIT 2025 in the Media" на фоне цифровой сетки и световых эффектов.

MIT в СМИ: обзор 2025 года

Члены сообщества MIT привлекли внимание общественности ключевыми научными достижениями и своими усилиями по решению актуальных проблем. Изображение: Новости MIT «В MIT инновации варьируются от впечатляющих технологий до приземленного творчества», — отметили в Chronicle во время визита в…

Мар 14, 2026
Диаграмма Венна: пересечение U-REGLE, M-REGLE и GWAS Catalog.

Раскрытие ценных генетических данных с помощью мультимодального ИИ на основе M-REGLE

M-REGLE (Multimodal REpresentation learning for Genetic discovery on Low-dimensional Embeddings) — это метод искусственного интеллекта, который одновременно анализирует несколько потоков медицинских данных. Совместное обучение на основе различных типов данных создает более полные представления и значительно повышает вероятность…

Мар 14, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых