Google анонсировала Gemini 3.5 Live Translate для мгновенного голосового перевода.

11.06.2026 ideipro.ru

При голосовом переводе сохраняются тон, темп и высота голоса говорящего, а для обеспечения безопасности используются водяные знаки SynthID.

NOVOSTI Фото: Аурих Лоусон Фото: Аурих Лоусон

Google уже много лет стремится к созданию функции перевода в реальном времени, называя это одним из своих «новаторских экспериментов в области машинного обучения». Мы видели множество демонстраций на мероприятиях Google, но для этого требовались телефоны Google, наушники или какое-либо другое специальное оборудование. В прошлом году Google предоставила возможность перевода в реальном времени большему числу пользователей в приложении Translate, и теперь расширяет его доступность. С выходом Gemini 3.5 Live Translate вы получите доступ к мгновенному переводу в большем количестве мест и с меньшей задержкой, чем когда-либо прежде.

Новая модель ИИ входит в семейство версий 3.5, представленных на конференции I/O. До сегодняшнего дня Google выпускала только Flash-версию, но мы ожидаем появления Pro-версии в ближайшие недели. Gemini 3.5 Live Translate — это модель преобразования речи в речь, настроенная на автоматическое распознавание и перевод более чем на 70 языков.

Google утверждает, что Gemini 3.5 Live Translate достаточно быстр, чтобы поддерживать обычный разговор, отставая от говорящего всего на несколько секунд, при этом точно передавая интонацию, темп и высоту тона. Короче говоря, голос звучит больше как ваш собственный, чем голос робота. Демонстрационные записи, сделанные в контролируемых условиях, звучат впечатляюще. Вам не придётся долго ждать, чтобы убедиться в возможностях модели самостоятельно.

Перевод речи в Google Meet с помощью Gemini 3.5 Live Translate.

Функция Gemini 3.5 Live Translate внедряется в различных частях экосистемы Google. Разработчики могут начать работу с публичной предварительной версией в API Gemini Live или AI Studio. Модель непрерывно обрабатывает речь и автоматически обрабатывает все многоязычные входные данные, избавляя разработчиков от необходимости вручную настраивать параметры. Она также отфильтровывает фоновый шум в шумной обстановке.

Начиная с этого месяца, избранные корпоративные клиенты также получат доступ к новой модели перевода в Google Meet, до более широкого внедрения. Google заявляет, что также дорабатывает интерфейс Meet, чтобы вывести функцию перевода в реальном времени на передний план. Наиболее примечательно, что функция перевода в реальном времени версии 3.5 скоро появится в приложении Google Translate для Android и iOS.

Представляем Gemini 3.5 Live Translate.

В конце прошлого года Google начала тестировать функцию живого перевода на основе Gemini в приложении с любыми наушниками (и в приложении для iOS); ранее для этого требовались наушники Pixel Buds от Google и телефон на Android. Ожидаемое обновление расширит возможности функции с добавлением новейшей модели 3.5. Теперь вы сможете использовать любые наушники, или же они вам вообще не понадобятся. Если у вас их нет под рукой, вы можете поднести телефон к уху, как во время разговора, чтобы услышать голосовой перевод. Однако этот «режим прослушивания» пока работает только на Android.

В новом режиме прослушивания пользователи могут слышать практически в реальном времени перевод экскурсии на испанский язык на английский язык прямо через наушник своего телефона.

Аудиопотоки из Gemini 3.5 Live Translate призваны звучать реалистично, даже если они не совсем точно имитируют голос пользователя. Однако Google по-прежнему действует осторожно. Все аудиопотоки Gemini 3.5 Live Translate будут содержать водяные знаки SynthID, интегрированные в данные волновой формы. Это пометит речь как сгенерированную искусственным интеллектом, и (в настоящее время) удалить это невозможно.

Источник: arstechnica.com

Оцените материал:

Оставить комментарий Отменить ответ

Для отправки комментария вам необходимо авторизоваться.

Google анонсировала Gemini 3.5 Live Translate для мгновенного голосового перевода.

Оставить комментарий Отменить ответ

🤖 Нельсон AI

Гайды, руководства и полезные статьи

Похожие записи

Похожие записи

Ученые предложили новый способ быстро долететь до Марса

Исследование предполагает: разумная жизнь из параллельной вселенной находится среди нас

AMD Ryzen 9 9950X3D2 со 192 Мбайтами кэша показал себя сразу в двух бенчмарках

Оставить комментарий Отменить ответ

Присоединяйтесь и подпишитесь на рассылку самых свежих новостей по Email

🤖 Нельсон AI