Как писать промпты для генерации картинок: рабочая структура
Нейросеть для генерации изображений закрыла старую боль тех, кто не умеет рисовать. Раньше блогер, автор статьи или владелец маленького магазина брал картинку из стока или поисковика — и она была у тысячи других. Теперь под пост, статью или карточку товара можно за пару минут получить своё уникальное изображение. Останавливает обычно одно: просьба «нарисуй красиво» выдаёт случайный результат, и человек решает, что «нейросети у меня не работают».
Работают. Просто картинкой нужно управлять, а не надеяться на удачу. Хорошая новость: основные визуальные приёмы давно описаны, и чтобы получить нужный кадр, достаточно собрать промпт по понятной схеме. Ниже — разбор этой схемы по блокам. К каждому блоку идёт живой пример: я прогнал свои промпты через бота Cyber AI на двух популярных моделях — Images 2.0 (это GPT Image от OpenAI) и Banana 2 PRO (это Nano Banana от Google). Промпты можно скопировать и поменять под себя.
Сразу оговорюсь: у генерации картинок есть три отдельные задачи — рисование с нуля, редактирование готового изображения и сборка одной картинки из нескольких референсов. Здесь подробно разбираю только первое, рисование с нуля. Это база, без которой остальные два сценария не имеют смысла.
Сначала решите, что хотите увидеть
Главная ошибка новичка — открыть нейросеть и сразу печатать промпт. Сильный кадр начинается на пару минут раньше, в голове. Прежде чем писать, ответьте себе на несколько вопросов: где будет жить картинка, кто её увидит, что должно считываться за первую секунду, что в кадре главное, какой нужен формат, где модели можно фантазировать, а что менять нельзя.
Звучит как занудство, но именно эти ответы определяют половину результата. Для рекламного постера важнее всего читаемость, настроение и место под текст. Для карточки товара — точная форма, чистый фон и честная тень. Для иллюстрации к рассказу — атмосфера и эмоция, а не реализм. Один и тот же объект в этих трёх случаях рисуется по-разному, и решает это не модель, а вы.
Если сформулировать требования с ходу не выходит — не мучайтесь в окне генерации. Рядом всегда есть обычный чат-бот. Спросите у него, какие бывают типы инфографики, на что смотреть в рекламном макете, чем отличается студийный портрет от репортажного. Я часто кидаю свой текст в чат и прошу: «накидай десять идей, как это проиллюстрировать, пока без готовых промптов, только идеи». Потом выбираю те, что нравятся, и уже под них прошу расписать промпт.
Универсальная структура промпта
Дальше — каркас, который работает в большинстве случаев. Не обязательно заполнять все строки: что пропустите, то модель достроит сама. Но чем точнее блоки, тем меньше сюрпризов.
Структура промпта для генерации картинок: 8 блоковСхема выглядит так: создай [тип изображения] для [задачи]. Главный объект — кто или что в кадре. Сцена и действие — где и что происходит. Композиция и камера — план и ракурс. Стиль — фото, рисунок, дизайн. Свет и цвет — источник света и палитра. Детали и фактуры — материалы и мелочи. Формат — пропорции. Ограничения — чего быть не должно. Разберём каждый блок с примером.
Тип изображения и задача
Тип отвечает на вопрос «что должно получиться»: иллюстрация, фото, постер, карточка товара, инфографика, обложка, иконка, кадр из фильма. Задача отвечает на вопрос «зачем это нужно»: привлечь внимание к посту, показать товар, объяснить идею, создать настроение. Задачу можно не указывать, но иногда модель работает заметно лучше, когда понимает цель кадра.
Вот мой пример. Я попросил постер для пекарни и специально оставил часть текста на усмотрение модели — название, часы работы и слоган. Обратите внимание, как чётко в начале промпта заданы и тип, и задача.
Постер пекарни по промпту — результат Images 2.0Images 2.0 справилась с русским текстом на твёрдую четвёрку: придумала название «Хлебный дом», слоган и расписание — всё читается. Если на постере текст важен, эта модель сейчас лучший выбор в боте. Не нравится результат — не переписывайте весь промпт, попросите модель проверить и поправить только надписи.
Главный объект
Главный объект — это центр внимания: человек, предмет, товар, животное, персонаж, здание или сцена целиком. Для человека уточняют пол, примерный возраст, одежду, позу, выражение лица, причёску, важные приметы. Для предмета — форму, материал, цвет, размер, состояние. Описывайте только то, что реально важно для задачи: если цвет глаз не влияет на кадр, его можно не упоминать.
Главных объектов может быть несколько — например, человек с собакой. Тогда опишите каждого отдельно, но не пытайтесь расписать вообще всё в кадре: внимание модели расплывается, и она выполнит задачу наполовину.
Главный объект в кадре: фото по промпту для нейросетиЗдесь два главных объекта — мужчина и собака, и каждый описан коротко, но по делу. Остальное (двор, ступени, листья) — фон, ему хватило одной строки.
Сцена и действие
Этот блок отвечает на три вопроса: где, когда и что происходит. Место — кофейня, улица, лес, студия, кухня. Время и условия — утро, вечер, дождь, снег, летний день. Действие — идёт, смотрит, держит предмет, едет на велосипеде. Условия и действия комбинируются: день может быть дождливым, а героиня — ехать и улыбаться одновременно.
Сцена и действие: аниме-иллюстрация по промптуСцена задана плотно: набережная, летний вечер, движение на велосипеде, ветер в волосах, отражение заката в воде. Из этого набора модель сама собрала живой кадр.
Композиция и ракурс
Игнорировать композицию — одна из самых частых ошибок. Модель выберет план и ракурс сама, но не факт, что её выбор совпадёт с вашим: вы ждёте крупный портрет, а получаете общий план. Поэтому стоит задавать три вещи. План — крупный, средний, общий, в полный рост. Ракурс — на уровне глаз, сверху, снизу, через плечо, три четверти. Расположение — объект по центру, слева или справа, много свободного места, место под текст сверху.
Композиция и низкий ракурс — промпт для генерации изображенияНизкий ракурс сделал всю драму: фигура выросла и стала главной в кадре, появилось ощущение кино. Поменяйте ракурс на «вид сверху» — и тот же мужчина превратится в маленькую точку на пустой набережной. Поиграйте с этими параметрами, чтобы почувствовать, как они работают вместе.
Стиль
Стиль — это визуальный язык картинки и главный способ уйти от вида дешёвого стока. Стилей очень много, и грубо их можно разбить на три группы. Фото: фотореалистичное, студийное, репортажное, предметное, плёночное, кадр из фильма. Иллюстрация: акварель, карандаш, цифровая живопись, детская книжная, комикс, манга, пиксель-арт. Дизайн: минималистичный постер, рекламный макет, инфографика, набор иконок.
Стиль: изометрическая иллюстрация с текстом в кадреОтдельно стоят стили со сложным текстом — рекламные макеты, инфографика, карты. Тут два подхода: либо дать модели минимальное ТЗ и принять её вариант, либо долго и аккуратно проработать все надписи через обычный чат. Главная трудность — подобрать столько текста, сколько без каши влезет в кадр. В моём примере модель сама придумала название квартала и вывески, и крупные подписи получились читаемыми.
Свет и цвет
Свет и цвет кажутся необязательными, но именно они задают настроение. Источник света — дневной, из окна, неон, экран, лампа, свечи, фары, луна. И его может быть несколько. Качество света — мягкий, жёсткий, контровой, рассеянный, тёплый, холодный. Палитра — тёплая, холодная, пастельная, неоновая, монохромная, приглушённая, премиальная.
Чтобы показать силу этого блока, я собрал коллаж из двух панелей с одной сценой, где меняются только свет и цвет. И заодно прогнал один и тот же промпт на двух моделях — удобный момент их сравнить.
Сначала результат Images 2.0:
Свет и цвет, один промпт — Images 2.0А вот тот же промпт в Banana 2 PRO:
Тот же промпт — Banana 2 PROСравнение получилось показательным. По возможностям модели близкие, но характер разный. Images 2.0 рисует художественнее, кадр живее и атмосфернее — поэтому для иллюстраций к постам я чаще беру именно её. Banana 2 PRO выдаёт картинку чуть ближе к чистому стоку, зато лучше держит сцену: левая и правая панели у неё совпадают плотнее, поза и фонтан почти идентичны. Это её сильная сторона и при редактировании — модель от Google реже меняет лишнее. Полезный вывод: для красивой иллюстрации берите Images 2.0, для точного повтора одной и той же сцены — Banana 2 PRO.
Детали и фактуры
Этим блоком поначалу можно пренебрегать — модель сделает разумный выбор сама. Но именно детали и фактуры делают картинку вашей, а не «ещё одной из нейросети». Материалы — стекло, металл, дерево, ткань, керамика, вода, снег, туман. Фактуры — матовая, глянцевая, шероховатая, пушистая, мокрая, прозрачная. И конкретные мелочи — пар над кофе, капли на стекле, складки ткани, текстура дерева.
Детали и фактуры: детская иллюстрация по промптуПеречисленные фактуры — иголки, глянец яблока, влажные листья, бумажная зернистость — собрали тёплую книжную картинку, которую не стыдно поставить на разворот. Без этих строк вышла бы пресная заготовка.
Формат
Формат я по привычке забываю указать через раз. А зря: если картинка понравилась, а пропорции не те, любое переделывание под новый формат меняет кадр, обычно в худшую сторону. Лучше задать формат сразу. Их немного, запомнить легко.
Форматы изображений под разные задачиСовсем коротко: 1:1 — квадратный пост, 4:5 — вертикальный пост для ленты, 9:16 — сторис и экран телефона, 16:9 — обложка и широкий кадр, 2:3 — постер, A4 — листовка или схема. В некоторых интерфейсах формат выбирается прямо из выпадающего списка, и это удобнее, чем прописывать его словами.
Исключения: что не добавлять
Обязательно подумайте, чего в кадре быть не должно. Например, Images 2.0 сильно тренировали на текст, и у неё есть привычка ставить надписи даже там, где их не просили. Короткое «без текста» решает проблему. Другой полезный запрет — «мало людей», если нужно сосредоточиться на главных героях, а не на толпе. Чаще всего исключения появляются на втором-третьем заходе: написали черновик, сгенерировали, увидели лишнее — и дописали ограничение.
Редактирование и самопроверка с ИИ
Тема редактирования тянет на отдельный текст, но без пары правил не обойтись — в длинных промптах модель нередко забывает одну-две инструкции, и их приходится доводить. Правило первое: добились приличного кадра — перечитайте промпт и проверьте, что модель пропустила, а потом дорисуйте это через редактирование. Правило второе: правьте по одному-два элемента за раз, не пытайтесь переделать весь кадр сразу. Правило третье: если вы долго редактируете один снимок и модель начала косячить, скачайте последний удачный кадр и продолжите в новом чате.
И ещё приём, который экономит нервы. У новых языковых моделей хорошо прокачано «зрение». Если кажется, что с картинкой что-то не так, но вы не понимаете что — загрузите её в чат-бот и попросите проверить изображение на ошибки. Часто модель замечает кривые руки, лишние пальцы или нестыковки теней быстрее вас.
Как повторить это у себя в боте
Все картинки выше я сделал в боте Cyber AI — там обе модели, Images 2.0 и Banana 2 PRO, лежат рядом. Повторить любой промпт можно так:
1. Открой бота Cyber AI в Telegram и нажми /start.
2. В главном меню выбери «Создать изображение».
3. Выбери модель: «Images 2.0 (ChatGPT)» для художественных кадров и текста или «Banana 2 PRO» для точного повтора сцены.
4. Нажми «Задать параметры» — откроется мини-приложение.
5. Выставь «Пропорцию» (или «Размер») и «Качество».
6. Вставь промпт в поле «Описание».
7. Нажми «Сгенерировать» — через 30-200 секунд бот пришлёт картинку прямо в чат.
Собрать свой промпт и сгенерировать картинку можно в нашем боте Cyber AI: Telegram | MAX
Частые вопросы
Как писать промпты для нейросети, если я новичок? Начните с трёх блоков — тип изображения, главный объект и формат. Этого хватает для первого осмысленного кадра. Остальные блоки (сцена, композиция, стиль, свет) добавляйте по одному, когда поймёте, как каждый влияет на результат.
Чем Images 2.0 отличается от Nano Banana 2? Images 2.0 рисует художественнее и лучше работает с надписями в кадре. Banana 2 PRO выдаёт более ровную, «стоковую» картинку, зато точнее сохраняет сцену при повторе и реже меняет лишнее при редактировании.
Почему нейросеть рисует не то, что я прошу? Чаще всего промпт слишком общий («нарисуй красиво») или, наоборот, перегружен десятком объектов сразу. Опишите один-два главных объекта чётко, а второстепенное оставьте модели.
На каком языке писать промпт? Для генерации картинок русского достаточно: и Images 2.0, и Banana 2 PRO понимают его хорошо. Если хотите текст на картинке — пишите этот текст на том языке, на котором он должен появиться в кадре.
Как убрать лишние надписи с картинки? Добавьте в конец промпта короткое ограничение «без текста». Если надписи всё равно лезут, повторите запрет и попросите модель убрать любой текст в кадре.
Сколько деталей добавлять в промпт? Ровно столько, сколько важно для задачи. Лишние признаки размывают внимание модели. Если сомневаетесь — опишите главный объект подробно, а фон в одну строку.
Какой формат выбрать? Под задачу: 16:9 для обложки и широкого кадра, 4:5 и 1:1 для ленты соцсетей, 9:16 для сторис. Формат лучше задавать сразу, а не переделывать готовую картинку.
Коротко
Сильная картинка из нейросети — это не везение, а разложенный на блоки промпт: тип и задача, главный объект, сцена, композиция, стиль, свет и цвет, детали, формат и запреты. Как только вы научитесь раскладывать даже сложную иллюстрацию на эти текстовые кусочки, генерация перестанет быть лотереей. Соберите свой первый промпт по схеме из статьи, прогоните в боте на двух моделях и сравните — так понимание приходит быстрее всего.
Готовые промпты на любой случай — в нашей галерее promptstudio.tools: открываешь карточку, копируешь промпт в один клик и меняешь под свою задачу.
Источник: vc.ru
Похожие записи
Оцените материал:
Присоединяйтесь и подпишитесь на рассылку самых свежих новостей по Email
Получайте свежие новости и идеи на почту. Без спама — только самое интересное.
Нажимая «Подписаться», вы соглашаетесь с политикой конфиденциальности.
