Структура промпта: как писать запрос к нейросети
Влад Воронежцев · · 7 мин чтения

Структура промпта - это порядок блоков в запросе к нейросети: цель, сцена, субъект, стиль, камера, ограничения и проверка результата. Если вы ищете, как правильно писать промпт для нейросети, начинайте не с красивых тегов, а с понятного брифа под конкретную модель и формат вывода.
- 1.
Начните с задачи, а не с красивых слов
Первый блок отвечает на вопрос: зачем нужен результат. Для GPT Image 2 это может быть «обложка для статьи, 16:9, без текста», для Midjourney 8.1 - «fashion editorial кадр для moodboard», для Kling 3.0 - «5-секундный ролик с одним движением камеры». Когда цель стоит в начале, модель выбирает правильную композицию: рекламный кадр оставляет место под продукт, UI-мокап строит сетку, видео-промпт держит действие во времени. Opten полезен именно на этом шаге: он показывает, где промпт звучит как набор слов, а где уже похож на рабочий бриф.
Было
красивая картинка, неон, девушка, камера, стильное, кинематографично
Стало
Задача: вертикальный fashion editorial кадр для moodboard. Субъект: модель в лаймовом плаще под дождем. Композиция: средний план, лицо не крупнее 30% кадра. Свет: мягкий неон, мокрый асфальт, без логотипов.

- 2.
Соберите промпт из пяти блоков
Базовая структура промпта держится на пяти блоках: `Purpose`, `Scene`, `Subject`, `Style and camera`, `Constraints`. Для image-моделей добавьте материал, освещение и текст в кавычках, если он должен появиться в кадре. Для video-моделей добавьте действие, вторичное движение и камеру. В Veo 3.1 и Kling 3.0 звук тоже лучше описывать явно: короткий диалог, ambience, SFX или тишина. Без этого модель часто придумывает лишнюю аудиодорожку или превращает спокойную сцену в клип с драматичной музыкой.
Было
кофейня будущего, робот-бариста, красиво, 4k, реализм
Стало
Purpose: 8-second video concept. Scene: quiet futuristic coffee shop at night. Subject: robot barista pouring espresso. Motion: slow hand movement, steam rising, camera push-in. Constraints: no crowd, no brand logos, no fast cuts.

- 3.
Подстройте структуру под модель
Одна структура не означает один и тот же текст для всех движков. GPT Image 2 любит естественный бриф и точный текст в кавычках. Nano Banana Pro и Imagen 4 Ultra хорошо отвечают на детальное описание материалов, цвета и микрофактуры. Midjourney 8.1 быстрее схватывает эстетические коды, но требует аккуратных `--no` и `--style`, чтобы не уйти в глянец. В видео Runway Gen-4.5 и Luma Ray 3 важнее глагол действия и физика движения, а не список объектов. Поэтому сначала выбирайте модель, потом пишите промпт.
Было
один и тот же промпт для GPT Image 2, Midjourney 8.1, Veo 3.1 и Runway Gen-4.5
Стало
Для GPT Image 2: подробный дизайнерский бриф. Для Midjourney 8.1: эстетический код + точные запреты. Для Kling 3.0: действие, камера, длительность, ограничения движения.

- 4.
Проверяйте первый рендер как диагностику
Практический кейс: в Kling 3.0 мы тестировали короткий ролик «дизайнер берет прозрачный планшет со стола и поворачивается к камере». Первый рендер дал шестой палец на правой руке и слишком резкий рывок камеры. Исправление было точечным: `preserve five fingers on each visible hand, slow handheld push-in, no sudden camera snap`. Мы не переписывали всю сцену; добавили только правило для руки и камеры. После этого действие осталось тем же, но артефакт ушел. Первый рендер нужен именно для такой диагностики, а не для оценки «нравится / не нравится».
Было
Designer picks up a transparent tablet and turns to camera, cinematic office, handheld camera.
Стало
Designer picks up a transparent tablet and turns to camera. Preserve five fingers on each visible hand. Slow handheld push-in, no sudden camera snap, no warped tablet edges.

- 5.
Исправляйте одну ось за итерацию
Самая дорогая ошибка - переписывать весь промпт после каждого неудачного результата. Если фон хороший, а лицо не то, меняйте только identity-блок. Если движение верное, но камера слишком быстрая, меняйте только camera-блок. Если в Seedance 2.0 или Runway Gen-4.5 сцена разваливается во времени, добавьте timestamp или порядок beat'ов, но не трогайте стиль. Такой ритм экономит кредиты и сохраняет удачные части генерации. Для команды это еще и проще обсуждать: «правим свет» понятнее, чем «перепридумываем ролик».
Было
Сделай лучше: больше реализма, другую камеру, красивее свет, меньше артефактов, лицо исправь, фон поменяй.
Стало
Итерация 2: сохранить сцену, позу и фон. Изменить только свет: мягкий боковой источник слева, меньше бликов на стекле, без изменения камеры.



