➡️ Google анонсировала Gemini Omni — новую мультимодальную модель, способную…
➡️ Google анонсировала Gemini Omni — новую мультимодальную модель, способную создавать контент практически из любых типов входных данных: текста, изображений, видео и аудио.
Первой версией стала Gemini Omni Flash, которая уже умеет генерировать и редактировать видео через обычный диалог. Пользователь может загружать свои ролики, менять объекты, персонажей, окружение и даже полностью перестраивать сюжет с сохранением логики сцены.
☀️ В Google заявляют, что Omni лучше понимает физику, причинно-следственные связи и может использовать знания из науки, истории и культуры для создания более реалистичных и осмысленных видео.
Фактически компания делает шаг к универсальному AI-редактору, где любое фото, видео, текст или голосовая команда становятся отправной точкой для создания нового контента.
❓ Как думаете, смогут ли такие модели со временем заменить традиционные видеоредакторы и большую часть работы видеопродакшена?


Добавить комментарий
Для отправки комментария вам необходимо авторизоваться.