Архив рубрики ~Лента новостей~

Google анонсировала Gemini 3.5 Live Translate для мгновенного голосового перевода.

При голосовом переводе сохраняются тон, темп и высота голоса говорящего, а для обеспечения безопасности используются водяные знаки SynthID.

c6ca630176708b40be45df64719ff4f1 Фото: Аурих Лоусон Фото: Аурих Лоусон

Google уже много лет стремится к созданию функции перевода в реальном времени, называя это одним из своих «новаторских экспериментов в области машинного обучения». Мы видели множество демонстраций на мероприятиях Google, но для этого требовались телефоны Google, наушники или какое-либо другое специальное оборудование. В прошлом году Google предоставила возможность перевода в реальном времени большему числу пользователей в приложении Translate, и теперь расширяет его доступность. С выходом Gemini 3.5 Live Translate вы получите доступ к мгновенному переводу в большем количестве мест и с меньшей задержкой, чем когда-либо прежде.

Новая модель ИИ входит в семейство версий 3.5, представленных на конференции I/O. До сегодняшнего дня Google выпускала только Flash-версию, но мы ожидаем появления Pro-версии в ближайшие недели. Gemini 3.5 Live Translate — это модель преобразования речи в речь, настроенная на автоматическое распознавание и перевод более чем на 70 языков.

Google утверждает, что Gemini 3.5 Live Translate достаточно быстр, чтобы поддерживать обычный разговор, отставая от говорящего всего на несколько секунд, при этом точно передавая интонацию, темп и высоту тона. Короче говоря, голос звучит больше как ваш собственный, чем голос робота. Демонстрационные записи, сделанные в контролируемых условиях, звучат впечатляюще. Вам не придётся долго ждать, чтобы убедиться в возможностях модели самостоятельно.

Перевод речи в Google Meet с помощью Gemini 3.5 Live Translate.

Функция Gemini 3.5 Live Translate внедряется в различных частях экосистемы Google. Разработчики могут начать работу с публичной предварительной версией в API Gemini Live или AI Studio. Модель непрерывно обрабатывает речь и автоматически обрабатывает все многоязычные входные данные, избавляя разработчиков от необходимости вручную настраивать параметры. Она также отфильтровывает фоновый шум в шумной обстановке.

Начиная с этого месяца, избранные корпоративные клиенты также получат доступ к новой модели перевода в Google Meet, до более широкого внедрения. Google заявляет, что также дорабатывает интерфейс Meet, чтобы вывести функцию перевода в реальном времени на передний план. Наиболее примечательно, что функция перевода в реальном времени версии 3.5 скоро появится в приложении Google Translate для Android и iOS.

Представляем Gemini 3.5 Live Translate.

В конце прошлого года Google начала тестировать функцию живого перевода на основе Gemini в приложении с любыми наушниками (и в приложении для iOS); ранее для этого требовались наушники Pixel Buds от Google и телефон на Android. Ожидаемое обновление расширит возможности функции с добавлением новейшей модели 3.5. Теперь вы сможете использовать любые наушники, или же они вам вообще не понадобятся. Если у вас их нет под рукой, вы можете поднести телефон к уху, как во время разговора, чтобы услышать голосовой перевод. Однако этот «режим прослушивания» пока работает только на Android.

В новом режиме прослушивания пользователи могут слышать практически в реальном времени перевод экскурсии на испанский язык на английский язык прямо через наушник своего телефона.

Аудиопотоки из Gemini 3.5 Live Translate призваны звучать реалистично, даже если они не совсем точно имитируют голос пользователя. Однако Google по-прежнему действует осторожно. Все аудиопотоки Gemini 3.5 Live Translate будут содержать водяные знаки SynthID, интегрированные в данные волновой формы. Это пометит речь как сгенерированную искусственным интеллектом, и (в настоящее время) удалить это невозможно.

Источник: arstechnica.com

✅ Найденные теги: Gemini, Google, Live, Translate, Анонсировала, новости
Читайте также
Архив рубрики ~Обо всем~ 7+ настроек конфиденциальности телефона, которые следует проверить и отключить как можно скорее, чтобы избежать раскрытия ваших личных данных. Архив рубрики ~Обо всем~ Привет, Siri! Теперь ты — основа для умных очков Apple. Архив рубрики ~Обо всем~ Помимо функции extract_text: два слоя PDF-файла, определяющие качество RAG. Архив рубрики ~Обо всем~ AT&T теперь предлагает дневные абонементы за 3 доллара на «безлимитный» мобильный интернет для iPad. Архив рубрики ~Обо всем~ Как смотреть Чемпионат мира по футболу FIFA 2026: 10 способов трансляции (включая бесплатные варианты) Архив рубрики ~Обо всем~ Байесовские сети и сети Маркова: интуитивно понятное руководство по структурированной неопределенности Архив рубрики ~Обо всем~ Премия EPICS от IEEE присуждается выдающимся студентам и преподавателям. Архив рубрики ~Обо всем~ Компания Waymo создала виртуального водителя-человека для улучшения своих роботакси. Архив рубрики ~Обо всем~ Мы создаём паноптикум с помощью краудсорсинга. Архив рубрики ~Обо всем~ Электромобили GM вскоре будут поддерживать больше типов общественных зарядных станций. Архив рубрики ~Обо всем~ Удаленная работа ухудшила психическое здоровье. Причиной стало увеличение времени в одиночестве Архив рубрики ~Обо всем~ Первый тест-драйв: Rivian R2 2027 года полностью меняет правила игры в мире электромобилей. Архив рубрики ~Обо всем~ Загадочный случай исчезновения носимого устройства Архив рубрики ~Обо всем~ Что произойдет, если Apple и Google объединятся для создания ИИ? 5 новых моделей. Архив рубрики ~Обо всем~ 7+ настроек конфиденциальности телефона, которые следует проверить и отключить как можно скорее, чтобы избежать раскрытия ваших личных данных. Архив рубрики ~Обо всем~ Привет, Siri! Теперь ты — основа для умных очков Apple. Архив рубрики ~Обо всем~ Помимо функции extract_text: два слоя PDF-файла, определяющие качество RAG. Архив рубрики ~Обо всем~ AT&T теперь предлагает дневные абонементы за 3 доллара на «безлимитный» мобильный интернет для iPad. Архив рубрики ~Обо всем~ Как смотреть Чемпионат мира по футболу FIFA 2026: 10 способов трансляции (включая бесплатные варианты) Архив рубрики ~Обо всем~ Байесовские сети и сети Маркова: интуитивно понятное руководство по структурированной неопределенности Архив рубрики ~Обо всем~ Премия EPICS от IEEE присуждается выдающимся студентам и преподавателям. Архив рубрики ~Обо всем~ Компания Waymo создала виртуального водителя-человека для улучшения своих роботакси. Архив рубрики ~Обо всем~ Мы создаём паноптикум с помощью краудсорсинга. Архив рубрики ~Обо всем~ Электромобили GM вскоре будут поддерживать больше типов общественных зарядных станций. Архив рубрики ~Обо всем~ Удаленная работа ухудшила психическое здоровье. Причиной стало увеличение времени в одиночестве Архив рубрики ~Обо всем~ Первый тест-драйв: Rivian R2 2027 года полностью меняет правила игры в мире электромобилей. Архив рубрики ~Обо всем~ Загадочный случай исчезновения носимого устройства Архив рубрики ~Обо всем~ Что произойдет, если Apple и Google объединятся для создания ИИ? 5 новых моделей.

Оставить комментарий

Подписка на рассылку

Получайте свежие новости и идеи на почту. Без спама — только самое интересное.

Нажимая «Подписаться», вы соглашаетесь с политикой конфиденциальности.