Архив рубрики ~Лента новостей~

Как писать промпты для генерации картинок: рабочая структура

Как писать промпты для генерации картинок: рабочая структура
Как писать промпты для генерации картинок: рабочая структура

Нейросеть для генерации изображений закрыла старую боль тех, кто не умеет рисовать. Раньше блогер, автор статьи или владелец маленького магазина брал картинку из стока или поисковика — и она была у тысячи других. Теперь под пост, статью или карточку товара можно за пару минут получить своё уникальное изображение. Останавливает обычно одно: просьба «нарисуй красиво» выдаёт случайный результат, и человек решает, что «нейросети у меня не работают».

Работают. Просто картинкой нужно управлять, а не надеяться на удачу. Хорошая новость: основные визуальные приёмы давно описаны, и чтобы получить нужный кадр, достаточно собрать промпт по понятной схеме. Ниже — разбор этой схемы по блокам. К каждому блоку идёт живой пример: я прогнал свои промпты через бота Cyber AI на двух популярных моделях — Images 2.0 (это GPT Image от OpenAI) и Banana 2 PRO (это Nano Banana от Google). Промпты можно скопировать и поменять под себя.

Сразу оговорюсь: у генерации картинок есть три отдельные задачи — рисование с нуля, редактирование готового изображения и сборка одной картинки из нескольких референсов. Здесь подробно разбираю только первое, рисование с нуля. Это база, без которой остальные два сценария не имеют смысла.

Сначала решите, что хотите увидеть

Главная ошибка новичка — открыть нейросеть и сразу печатать промпт. Сильный кадр начинается на пару минут раньше, в голове. Прежде чем писать, ответьте себе на несколько вопросов: где будет жить картинка, кто её увидит, что должно считываться за первую секунду, что в кадре главное, какой нужен формат, где модели можно фантазировать, а что менять нельзя.

Звучит как занудство, но именно эти ответы определяют половину результата. Для рекламного постера важнее всего читаемость, настроение и место под текст. Для карточки товара — точная форма, чистый фон и честная тень. Для иллюстрации к рассказу — атмосфера и эмоция, а не реализм. Один и тот же объект в этих трёх случаях рисуется по-разному, и решает это не модель, а вы.

Если сформулировать требования с ходу не выходит — не мучайтесь в окне генерации. Рядом всегда есть обычный чат-бот. Спросите у него, какие бывают типы инфографики, на что смотреть в рекламном макете, чем отличается студийный портрет от репортажного. Я часто кидаю свой текст в чат и прошу: «накидай десять идей, как это проиллюстрировать, пока без готовых промптов, только идеи». Потом выбираю те, что нравятся, и уже под них прошу расписать промпт.

Универсальная структура промпта

Дальше — каркас, который работает в большинстве случаев. Не обязательно заполнять все строки: что пропустите, то модель достроит сама. Но чем точнее блоки, тем меньше сюрпризов.

Структура промпта для генерации картинок: 8 блоковСтруктура промпта для генерации картинок: 8 блоков

Схема выглядит так: создай [тип изображения] для [задачи]. Главный объект — кто или что в кадре. Сцена и действие — где и что происходит. Композиция и камера — план и ракурс. Стиль — фото, рисунок, дизайн. Свет и цвет — источник света и палитра. Детали и фактуры — материалы и мелочи. Формат — пропорции. Ограничения — чего быть не должно. Разберём каждый блок с примером.

Тип изображения и задача

Тип отвечает на вопрос «что должно получиться»: иллюстрация, фото, постер, карточка товара, инфографика, обложка, иконка, кадр из фильма. Задача отвечает на вопрос «зачем это нужно»: привлечь внимание к посту, показать товар, объяснить идею, создать настроение. Задачу можно не указывать, но иногда модель работает заметно лучше, когда понимает цель кадра.

Вот мой пример. Я попросил постер для пекарни и специально оставил часть текста на усмотрение модели — название, часы работы и слоган. Обратите внимание, как чётко в начале промпта заданы и тип, и задача.

Создай рекламный постер для городской пекарни, чтобы передать запах свежего хлеба и тёплое субботнее утро. На деревянном прилавке лежит румяный круассан и стоит стакан какао, на фоне мягко расфокусированная витрина с выпечкой, тёплый утренний свет из окна, фотореалистичный рекламный стиль. Формат 3:4, название пекарни, часы работы и короткий слоган придумай сам.
Постер пекарни по промпту - результат Images 2.0Постер пекарни по промпту — результат Images 2.0

Images 2.0 справилась с русским текстом на твёрдую четвёрку: придумала название «Хлебный дом», слоган и расписание — всё читается. Если на постере текст важен, эта модель сейчас лучший выбор в боте. Не нравится результат — не переписывайте весь промпт, попросите модель проверить и поправить только надписи.

Главный объект

Главный объект — это центр внимания: человек, предмет, товар, животное, персонаж, здание или сцена целиком. Для человека уточняют пол, примерный возраст, одежду, позу, выражение лица, причёску, важные приметы. Для предмета — форму, материал, цвет, размер, состояние. Описывайте только то, что реально важно для задачи: если цвет глаз не влияет на кадр, его можно не упоминать.

Главных объектов может быть несколько — например, человек с собакой. Тогда опишите каждого отдельно, но не пытайтесь расписать вообще всё в кадре: внимание модели расплывается, и она выполнит задачу наполовину.

Создай фото молодого мужчины со светлой бородой в сером пальто, который сидит на ступенях крыльца и держит на коленях рыжего корги. Городской двор ранней осенью, опавшие листья, спокойный солнечный день. Мягкий дневной свет, тёплые натуральные цвета, реалистичный стиль. Формат 4:3, без текста.
Главный объект в кадре: фото по промпту для нейросетиГлавный объект в кадре: фото по промпту для нейросети

Здесь два главных объекта — мужчина и собака, и каждый описан коротко, но по делу. Остальное (двор, ступени, листья) — фон, ему хватило одной строки.

Сцена и действие

Этот блок отвечает на три вопроса: где, когда и что происходит. Место — кофейня, улица, лес, студия, кухня. Время и условия — утро, вечер, дождь, снег, летний день. Действие — идёт, смотрит, держит предмет, едет на велосипеде. Условия и действия комбинируются: день может быть дождливым, а героиня — ехать и улыбаться одновременно.

Создай аниме-иллюстрацию для соцсетей. Девочка-подросток в лёгком сарафане едет на велосипеде по набережной летним вечером, в корзинке лежит букет полевых цветов, волосы развеваются на ветру, вода отражает закат. Стиль современного аниме, выразительные эмоции, мягкие тёплые цвета, лёгкая живая атмосфера. Формат 1:1.
Сцена и действие: аниме-иллюстрация по промптуСцена и действие: аниме-иллюстрация по промпту

Сцена задана плотно: набережная, летний вечер, движение на велосипеде, ветер в волосах, отражение заката в воде. Из этого набора модель сама собрала живой кадр.

Композиция и ракурс

Игнорировать композицию — одна из самых частых ошибок. Модель выберет план и ракурс сама, но не факт, что её выбор совпадёт с вашим: вы ждёте крупный портрет, а получаете общий план. Поэтому стоит задавать три вещи. План — крупный, средний, общий, в полный рост. Ракурс — на уровне глаз, сверху, снизу, через плечо, три четверти. Расположение — объект по центру, слева или справа, много свободного места, место под текст сверху.

Создай фотореалистичную кинематографичную иллюстрацию. Мужчина в длинном тёмном пальто стоит на ночной набережной у воды, спиной к камере, и смотрит на огни моста вдалеке. Низкий ракурс, камера чуть выше уровня досок причала и смотрит вверх, фигура доминирует в кадре, на переднем плане блики на мокром настиле. Холодный синий свет ночи и тёплые точки фонарей, задумчивая атмосфера. Формат 16:9, без текста и логотипов.
Композиция и низкий ракурс - промпт для генерации изображенияКомпозиция и низкий ракурс — промпт для генерации изображения

Низкий ракурс сделал всю драму: фигура выросла и стала главной в кадре, появилось ощущение кино. Поменяйте ракурс на «вид сверху» — и тот же мужчина превратится в маленькую точку на пустой набережной. Поиграйте с этими параметрами, чтобы почувствовать, как они работают вместе.

Стиль

Стиль — это визуальный язык картинки и главный способ уйти от вида дешёвого стока. Стилей очень много, и грубо их можно разбить на три группы. Фото: фотореалистичное, студийное, репортажное, предметное, плёночное, кадр из фильма. Иллюстрация: акварель, карандаш, цифровая живопись, детская книжная, комикс, манга, пиксель-арт. Дизайн: минималистичный постер, рекламный макет, инфографика, набор иконок.

Создай изометрическую иллюстрацию для туристического путеводителя. Маленький вымышленный квартал в японском стиле: деревянные домики, бумажные фонарики, цветущая сакура и узкие улочки со ступеньками. Формат 16:9, текстом подпиши название квартала, главную улицу и пару заведений.
Стиль: изометрическая иллюстрация с текстом в кадреСтиль: изометрическая иллюстрация с текстом в кадре

Отдельно стоят стили со сложным текстом — рекламные макеты, инфографика, карты. Тут два подхода: либо дать модели минимальное ТЗ и принять её вариант, либо долго и аккуратно проработать все надписи через обычный чат. Главная трудность — подобрать столько текста, сколько без каши влезет в кадр. В моём примере модель сама придумала название квартала и вывески, и крупные подписи получились читаемыми.

Свет и цвет

Свет и цвет кажутся необязательными, но именно они задают настроение. Источник света — дневной, из окна, неон, экран, лампа, свечи, фары, луна. И его может быть несколько. Качество света — мягкий, жёсткий, контровой, рассеянный, тёплый, холодный. Палитра — тёплая, холодная, пастельная, неоновая, монохромная, приглушённая, премиальная.

Чтобы показать силу этого блока, я собрал коллаж из двух панелей с одной сценой, где меняются только свет и цвет. И заодно прогнал один и тот же промпт на двух моделях — удобный момент их сравнить.

Создай коллаж для статьи о свете и цвете из двух соседних панелей с одной и той же сценой. Уличный скрипач играет на старой брусчатой площади у фонтана. Левая панель — солнечный полдень: ровный тёплый свет, светлая пастельная палитра, спокойное умиротворённое настроение. Правая панель — ночь: неоновые вывески и свет фонарей, сине-фиолетовая палитра с тёплыми акцентами, более драматичная атмосфера. Поза музыканта, ракурс, композиция площади и расположение объектов в обеих частях одинаковые; меняются только свет, цвет и настроение. Формат 16:9.

Сначала результат Images 2.0:

Свет и цвет, один промпт - Images 2.0Свет и цвет, один промпт — Images 2.0

А вот тот же промпт в Banana 2 PRO:

Тот же промпт - Banana 2 PROТот же промпт — Banana 2 PRO

Сравнение получилось показательным. По возможностям модели близкие, но характер разный. Images 2.0 рисует художественнее, кадр живее и атмосфернее — поэтому для иллюстраций к постам я чаще беру именно её. Banana 2 PRO выдаёт картинку чуть ближе к чистому стоку, зато лучше держит сцену: левая и правая панели у неё совпадают плотнее, поза и фонтан почти идентичны. Это её сильная сторона и при редактировании — модель от Google реже меняет лишнее. Полезный вывод: для красивой иллюстрации берите Images 2.0, для точного повтора одной и той же сцены — Banana 2 PRO.

Детали и фактуры

Этим блоком поначалу можно пренебрегать — модель сделает разумный выбор сама. Но именно детали и фактуры делают картинку вашей, а не «ещё одной из нейросети». Материалы — стекло, металл, дерево, ткань, керамика, вода, снег, туман. Фактуры — матовая, глянцевая, шероховатая, пушистая, мокрая, прозрачная. И конкретные мелочи — пар над кофе, капли на стекле, складки ткани, текстура дерева.

Создай иллюстрацию для детской книги. Маленький ёжик идёт по осеннему лесу и несёт на иголках спелое красное яблоко. Тёплая сказочная атмосфера, мягкие округлые формы. Детали и фактуры: колючие иголки ёжика, глянцевый бок яблока, влажные опавшие листья, мягкий мох на камне, лёгкая бумажная зернистость иллюстрации. Формат 4:3, без текста.
Детали и фактуры: детская иллюстрация по промптуДетали и фактуры: детская иллюстрация по промпту

Перечисленные фактуры — иголки, глянец яблока, влажные листья, бумажная зернистость — собрали тёплую книжную картинку, которую не стыдно поставить на разворот. Без этих строк вышла бы пресная заготовка.

Формат

Формат я по привычке забываю указать через раз. А зря: если картинка понравилась, а пропорции не те, любое переделывание под новый формат меняет кадр, обычно в худшую сторону. Лучше задать формат сразу. Их немного, запомнить легко.

Форматы изображений под разные задачиФорматы изображений под разные задачи

Совсем коротко: 1:1 — квадратный пост, 4:5 — вертикальный пост для ленты, 9:16 — сторис и экран телефона, 16:9 — обложка и широкий кадр, 2:3 — постер, A4 — листовка или схема. В некоторых интерфейсах формат выбирается прямо из выпадающего списка, и это удобнее, чем прописывать его словами.

Исключения: что не добавлять

Обязательно подумайте, чего в кадре быть не должно. Например, Images 2.0 сильно тренировали на текст, и у неё есть привычка ставить надписи даже там, где их не просили. Короткое «без текста» решает проблему. Другой полезный запрет — «мало людей», если нужно сосредоточиться на главных героях, а не на толпе. Чаще всего исключения появляются на втором-третьем заходе: написали черновик, сгенерировали, увидели лишнее — и дописали ограничение.

Редактирование и самопроверка с ИИ

Тема редактирования тянет на отдельный текст, но без пары правил не обойтись — в длинных промптах модель нередко забывает одну-две инструкции, и их приходится доводить. Правило первое: добились приличного кадра — перечитайте промпт и проверьте, что модель пропустила, а потом дорисуйте это через редактирование. Правило второе: правьте по одному-два элемента за раз, не пытайтесь переделать весь кадр сразу. Правило третье: если вы долго редактируете один снимок и модель начала косячить, скачайте последний удачный кадр и продолжите в новом чате.

И ещё приём, который экономит нервы. У новых языковых моделей хорошо прокачано «зрение». Если кажется, что с картинкой что-то не так, но вы не понимаете что — загрузите её в чат-бот и попросите проверить изображение на ошибки. Часто модель замечает кривые руки, лишние пальцы или нестыковки теней быстрее вас.

Как повторить это у себя в боте

Все картинки выше я сделал в боте Cyber AI — там обе модели, Images 2.0 и Banana 2 PRO, лежат рядом. Повторить любой промпт можно так:

1. Открой бота Cyber AI в Telegram и нажми /start.

2. В главном меню выбери «Создать изображение».

3. Выбери модель: «Images 2.0 (ChatGPT)» для художественных кадров и текста или «Banana 2 PRO» для точного повтора сцены.

4. Нажми «Задать параметры» — откроется мини-приложение.

5. Выставь «Пропорцию» (или «Размер») и «Качество».

6. Вставь промпт в поле «Описание».

7. Нажми «Сгенерировать» — через 30-200 секунд бот пришлёт картинку прямо в чат.

Собрать свой промпт и сгенерировать картинку можно в нашем боте Cyber AI: Telegram | MAX

Частые вопросы

Как писать промпты для нейросети, если я новичок? Начните с трёх блоков — тип изображения, главный объект и формат. Этого хватает для первого осмысленного кадра. Остальные блоки (сцена, композиция, стиль, свет) добавляйте по одному, когда поймёте, как каждый влияет на результат.

Чем Images 2.0 отличается от Nano Banana 2? Images 2.0 рисует художественнее и лучше работает с надписями в кадре. Banana 2 PRO выдаёт более ровную, «стоковую» картинку, зато точнее сохраняет сцену при повторе и реже меняет лишнее при редактировании.

Почему нейросеть рисует не то, что я прошу? Чаще всего промпт слишком общий («нарисуй красиво») или, наоборот, перегружен десятком объектов сразу. Опишите один-два главных объекта чётко, а второстепенное оставьте модели.

На каком языке писать промпт? Для генерации картинок русского достаточно: и Images 2.0, и Banana 2 PRO понимают его хорошо. Если хотите текст на картинке — пишите этот текст на том языке, на котором он должен появиться в кадре.

Как убрать лишние надписи с картинки? Добавьте в конец промпта короткое ограничение «без текста». Если надписи всё равно лезут, повторите запрет и попросите модель убрать любой текст в кадре.

Сколько деталей добавлять в промпт? Ровно столько, сколько важно для задачи. Лишние признаки размывают внимание модели. Если сомневаетесь — опишите главный объект подробно, а фон в одну строку.

Какой формат выбрать? Под задачу: 16:9 для обложки и широкого кадра, 4:5 и 1:1 для ленты соцсетей, 9:16 для сторис. Формат лучше задавать сразу, а не переделывать готовую картинку.

Коротко

Сильная картинка из нейросети — это не везение, а разложенный на блоки промпт: тип и задача, главный объект, сцена, композиция, стиль, свет и цвет, детали, формат и запреты. Как только вы научитесь раскладывать даже сложную иллюстрацию на эти текстовые кусочки, генерация перестанет быть лотереей. Соберите свой первый промпт по схеме из статьи, прогоните в боте на двух моделях и сравните — так понимание приходит быстрее всего.

Готовые промпты на любой случай — в нашей галерее promptstudio.tools: открываешь карточку, копируешь промпт в один клик и меняешь под свою задачу.

Источник: vc.ru

Оцените материал:

Поделиться
Понравилась статья? Расскажите другим
ВКонтакте
Читайте также
Архив рубрики ~Обо всем~ Фитнес-браслет Google Fitbit Air — это носимое устройство без экрана за 99 долларов, к которому я действительно могу относиться серьезно. Новости робототехники FAULHABER уделяет особое внимание крутящему моменту, шуму и работе с новыми редукторами GPT. Архив рубрики ~Обо всем~ Скидка на этот превосходный OLED-телевизор — это лучшее предложение, которое я нашел до сих пор, если сравнивать с ценой в Prime Day. Новости робототехники GM устанавливает роботов на своем флагманском заводе по производству электромобилей после увольнения 1300 сотрудников. Новости робототехники Mantis Robotics запускает робота двумя руками и без ограждения Новости робототехники Производитель гуманоидов Agility Robotics выйдет на рынок в результате слияния со SPAC Новости робототехники [Перевод] Как , пробежал полумарафон быстрее человека Новости робототехники Сами читают статьи и ставят видеокарты: Nvidia показала самообучающихся роботов ENPIRE Новости робототехники Роботы-уборщики с искусственным интеллектом покидают лаборатории и отправляются в гостиные Китая. Новости робототехники ExRobotics запускает сертифицированную UL инспекционную роботу для программной среды Новости робототехники Первая роботизированная буровая установка на материковой части России создана на базе российских программных продуктов IR-ПАК и IR-OPERBOT от РИГИНТЕЛ Архив рубрики ~Коротко из Telegram~ Google запускает собственную «мини-Википедию» для блогеров и создателей контента. Компания… Архив рубрики ~Коротко из Telegram~ Водители Tesla научились обманывать камеру слежения в салоне головой пластиковой… Архив рубрики ~Коротко из Telegram~ Главная компания ИИ-гонки не выпускает ни моделей, ни чипов ASML… Архив рубрики ~Обо всем~ Фитнес-браслет Google Fitbit Air — это носимое устройство без экрана за 99 долларов, к которому я действительно могу относиться серьезно. Новости робототехники FAULHABER уделяет особое внимание крутящему моменту, шуму и работе с новыми редукторами GPT. Архив рубрики ~Обо всем~ Скидка на этот превосходный OLED-телевизор — это лучшее предложение, которое я нашел до сих пор, если сравнивать с ценой в Prime Day. Новости робототехники GM устанавливает роботов на своем флагманском заводе по производству электромобилей после увольнения 1300 сотрудников. Новости робототехники Mantis Robotics запускает робота двумя руками и без ограждения Новости робототехники Производитель гуманоидов Agility Robotics выйдет на рынок в результате слияния со SPAC Новости робототехники [Перевод] Как , пробежал полумарафон быстрее человека Новости робототехники Сами читают статьи и ставят видеокарты: Nvidia показала самообучающихся роботов ENPIRE Новости робототехники Роботы-уборщики с искусственным интеллектом покидают лаборатории и отправляются в гостиные Китая. Новости робототехники ExRobotics запускает сертифицированную UL инспекционную роботу для программной среды Новости робототехники Первая роботизированная буровая установка на материковой части России создана на базе российских программных продуктов IR-ПАК и IR-OPERBOT от РИГИНТЕЛ Архив рубрики ~Коротко из Telegram~ Google запускает собственную «мини-Википедию» для блогеров и создателей контента. Компания… Архив рубрики ~Коротко из Telegram~ Водители Tesla научились обманывать камеру слежения в салоне головой пластиковой… Архив рубрики ~Коротко из Telegram~ Главная компания ИИ-гонки не выпускает ни моделей, ни чипов ASML…

Оставить комментарий