ideipro logotyp

Правила генерации в Veo3 опытным и непростым путём (чтобы сделать вот такую смешинку)

Вчера я сел попробовать Veo3, самую крутую видео-нейросетку на данный момент, и сделал mindfulness-смешинку выше.

Доступ к Veo3 я получил очень просто — у меня был американский Google-аккаунт, и он разрешил оформить триал на тариф за $20.

И вот я стал счастливым обладателем 10 генераций. Кстати, интересно: когда через интерфейс Gemini я использовал все 10 кредитов, он сообщил, что новые лимиты появятся только 31 мая. Надеюсь, это не шутка.

Какие правила я выделил:

1. Даже в консоли Gemini промпт пишем на английском, но прямую речь в кавычках можно писать на русском языке. Так и пишем:

…(he/she) says in Russian: «….»

Тогда речь действительно будет на русском. Также можно добавить надпись на русском (как я сделал на видео с надписью «СССР»).

Кстати, английский язык генерируется гораздо лучше русского.

2. Помните, что видео может быть максимум 8 секунд, и с прямой речью работает только text-to-video. То есть нельзя загрузить картинку, чтобы она заговорила. А ещё, если вы захотите продолжить генерацию, то там будет уже Veo2, а не Veo3. В общем, используйте свои 8 секунд аккуратно. Если нужен тот же персонаж, точной копии не будет — придётся максимально подробно описывать его заново, чтобы хотя бы был похож.

3. Важно: если хотите прямую речь или пение, не прописывайте персонажу никаких действий кроме says или sings. Иначе он начнёт совершать действие (например, брить мужика как ниже), но не заговорит (с английской речью тут попроще).

4. Можно указать каждую деталь: музыку, шумы, акценты, эмоции. Промпт может быть большим, но учитывайте, что всё это должно уложиться в 8 секунд. А ещё имейте в виду, что не больше половины запросов генерируется без галлюцинаций. Вот пример. Просто внезапно она перевела мою русскую речь на английский.

5. Можно делать акценты! Например, на втором видео был грузин, которому я прописал русский язык с грузинским акцентом. Без аудио тоже иногда генерится, просто нет звука. И пожаловаться некому. В общем 30% только нормального результата.

6. Пишите цифры словами для правильного произношения, а также не используйте тире — иначе ваш персонаж может случайно матюкнуться, как это произошло с моим милиционером.

Итогом, сделать видео в veo3 заняло около часа.

пожалуй всё, ещё два-три месяца, и это действительно будет уже продакшн-уровень для фильмов. Главное, чтобы цена снизилась, а то 8 секунд стоит 200-300 рублей.

== Но я не успокоился, и решил всё адаптировать под вертикальный формат.

Но как это сделать, когда у меня 16 на 9 видео?

1. Идём в RunwayML (http://runwayml.com/), выбираем «создать сессию», а затем выбираем Gen-3-Alpha-Turbo

2. В менюшке справа, которая состоит из 4 значков, выбираю последний — Expand video

3. Загружаю видео и расширяю границы куда надо — из рилса также можно сделать горизонтальный формат. А далее ввожу промт — там просто описываю, что мне надо или не надо видеть. Коротенький, типа «минималистичная улица, без надписей»

4. Чтобы совсем хорошо было, у готовой генерации снизу нажимаю 4к, и получаю видео в соответствующем качестве! Тогда и увеличивать можно не боясь как я вот тут сделал.

Результат вот такой получается:

P.S. Звук оригинальный остаётся, можно не бояться.

P.P.S. Шутки написал не я, а Claude 4 sonnet 🙂 Он ограниченно бесплатный с VPN.

Если будет настроение — заходите в мой тг канал, там тоже всякую практику из своей работы даю по вайбкодингу, автоматизации и вот таким вот штукам выше.

Источник: habr.com

❌ Нет тегов для этой статьи
Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Текст на изображении: "Программисты всё?" на черном фоне.
ideipro logotyp
Диаграмма базы данных для клона Slack с таблицами пользователей, сообщений и каналов.
ideipro logotyp
ideipro logotyp
Человек работает за ноутбуком, презентация платформы GigaChat Enterprise для бизнеса.
Ноутбук с открытым проектом в Adobe Photoshop, изображение колибри и цветка.
Apple M5 Pro и M5 Max чипы на темном фоне, логотипы в синем и фиолетовом свете.
Ноутбук с открытым приложением для редактирования фотографий на экране.
Image Not Found
Звёздное небо с галактиками и туманностями, космос, Вселенная, астрофотография.

Система оповещения обсерватории Рубина отправила 800 000 сигналов в первую ночь наблюдений.

Астрономы будут получать оповещения о небесных явлениях в течение нескольких минут после их обнаружения. Теренс О'Брайен, редактор раздела «Выходные». Публикации этого автора будут добавляться в вашу ежедневную рассылку по электронной почте и в ленту новостей на главной…

Мар 2, 2026
Женщина с длинными тёмными волосами в синем свете, нейтральный фон.

Расследование в отношении 61-фунтовой машины, которая «пожирает» пластик и выплевывает кирпичи.

Обзор компактного пресса для мягкого пластика Clear Drop — и что будет дальше. Шон Холлистер, старший редактор Публикации этого автора будут добавляться в вашу ежедневную рассылку по электронной почте и в ленту новостей на главной странице вашего…

Мар 2, 2026
Черный углеродное волокно с текстурой плетения, отражающий свет.

Материал будущего: как работает «бессмертный» композит

Учёные из Университета штата Северная Каролина представили композит нового поколения, способный самостоятельно восстанавливаться после серьёзных повреждений.  Речь идёт о модифицированном армированном волокном полимере (FRP), который не просто сохраняет прочность при малом весе, но и способен «залечивать» внутренние…

Мар 2, 2026
Круглый экран с изображением замка и горы, рядом электронная плата.

Круглый дисплей Waveshare для креативных проектов

Круглый 7-дюймовый сенсорный дисплей от Waveshare создан для разработчиков и дизайнеров, которым нужен нестандартный экран.  Это IPS-панель с разрешением 1 080×1 080 пикселей, поддержкой 10-точечного ёмкостного сенсора, оптической склейкой и защитным закалённым стеклом, выполненная в круглом форм-факторе.…

Мар 2, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых