Midjourney: как писать промпты, которые модель понимает
MidJourney · Обновлено:
Midjourney — серия image-моделей от компании Midjourney, доступная через midjourney.com и Discord. Линейка включает V7 (основная), V8 Alpha (новая, web-only), Niji 6/7 (аниме). Все версии используют общий синтаксис параметров (--ar, --s, --sref) и иерархию промпта, но V7+ требуют естественного языка вместо списков тегов.
Что нужно знать о Midjourney
Midjourney — закрытая модель с подпиской ($10/$30/$60/$120 в месяц). Все версии выдают 4 вариации на запрос, поддерживают любое соотношение сторон через `--ar`, и оптимизированы под английский язык.
Ключевая ось — выбор версии. V7 — основная, лучший фотореализм, естественный язык. V8 Alpha — буквальная интерпретация, нативное 2K через `--hd`, доступна только на alpha.midjourney.com. Niji 6/7 — специализированная аниме-модель с понимаем терминологии манги и аниме. V5.2/V6 считаются устаревшими и не рекомендуются без специальных причин.
- Версии: V7 (основная), V8 Alpha (web-only), Niji 6/7 (аниме)
- Любое соотношение сторон через --ar
- Лучше всего работает с английским
- 4 вариации на запрос, до 6000 символов промпта
- Negative prompt --no работает надёжно в V8
Структура промпта
Универсальная иерархия для всех версий: [Субъект] + [Детали субъекта] + [Контекст/среда] + [Стиль/настроение] + [Камера/освещение] + [Параметры].
Слова в начале весят больше — выноси главный субъект в первое предложение. «Beautiful cinematic photo of a woman» (стиль первый) работает хуже, чем «A confident businesswoman in her 40s, standing by floor-to-ceiling windows, soft daylight, 85mm lens».
Для V7 и V8 пиши связными предложениями, как описание для кинооператора. Списки ключевых слов через запятую — антипаттерн: «mountain, fog, sunrise, epic» уступает «A snow-capped mountain emerging from fog at sunrise, dramatic warm light on the peaks».
Основные параметры
Базовые параметры одинаковы во всех версиях: `--ar` (соотношение сторон), `--v` (версия модели, 7 по умолчанию), `--s` или `--stylize` (0–1000, дефолт 100 — сила интерпретации), `--c` или `--chaos` (0–100, разнообразие 4 вариаций), `--w` или `--weird` (0–3000, экспериментальность), `--no` (негативный промпт), `--seed` для воспроизводимости.
Стилевые: `--style raw` (минимальная художественная обработка), `--p` (персонализация), `--sref [URL]` (style reference) с весом `--sw`, `--iw` (image weight), `--niji` (переключение на аниме-модель). Параметр `--cref` (character reference) работает только в Niji 6, в V7 и V8 удалён.
Диапазон `--s`: 0–50 — продуктовые/технические фото, 50–150 — общее использование (дефолт), 150–300 — атмосферные работы, 300–500 — иллюстрации и концепт-арт, 500–1000 — абстракция и эксперименты.
Выбор версии под задачу
V7 — выбор по умолчанию для большинства задач: лучший фотореализм, естественный язык, рендеринг текста, персонализация. Доступна и через Discord, и через веб.
V8 Alpha — для задач, где нужно нативное 2K разрешение (--hd), точная буквальная интерпретация без художественного «улучшения», скорость в 5 раз выше V7, или максимально надёжный негативный промпт (--no работает значительно лучше). Доступна только на alpha.midjourney.com, без Discord.
Niji 6/7 — для аниме, манги, восточной иллюстрации. Понимает терминологию: «shoujo heroine», «cel shading», «mahou shoujo», «studio ghibli style». Niji 7 — текущая рекомендуемая версия, Niji 6 нужна только если требуются стилевые пресеты (--style expressive/cute/scenic) или --cref.
Типичные ошибки
1. Списки ключевых слов через запятую
Главный антипаттерн V7+. «cat, fluffy, cute, big eyes, garden, flowers, sunny» хуже, чем «A fluffy cat with big curious eyes, sitting among wildflowers in a sunny garden». Версии до V6 терпели запятые, V7 и V8 ожидают связную грамматику.
2. Quality-спам в начале промпта
«beautiful, stunning, 8k, masterpiece, best quality» — слова без визуальной информации, которые жгут позиционный вес в начале. V7 и V8 их полностью игнорируют. Замени на конкретные опоры: объектив, тип света, жанр.
3. Стиль перед субъектом
«Beautiful cinematic photo of a woman» — стиль на первом месте, субъект на третьем. Модель взвешивает первые слова сильнее всего, и стиль перетянет приоритет на себя. Выноси «кто или что» в начало.
4. Использование устаревших версий без причины
V5/V6 значительно уступают V7 в анатомии, фотореализме и понимании промпта. Если нет специфической причины (например, --cref в Niji 6), используй текущую V7 или V8. Старые версии — это технический долг.
5. Смена --ar после нескольких итераций
Соотношение сторон критически влияет на композицию. Поменял --ar с 1:1 на 16:9 — фактически начинаешь с нуля, потому что композиция перестраивается полностью. Решай --ar в начале проекта и не меняй посреди итераций.
Примеры до/после
Пример 1
Было
beautiful, stunning, 8k, detailed, mountain, fog, sunrise, epic, cinematic, masterpiece
Стало
A snow-capped mountain emerging from morning fog at sunrise, dramatic warm light catching the peaks, wide-angle composition, national geographic photography, atmospheric haze --ar 16:9 --s 150 --v 7
Quality-спам и список тегов — двойной антипаттерн. Связное описание с конкретным светом и жанровой опорой («national geographic photography») даёт стабильно лучший результат.
Пример 2
Было
anime girl with sword
Стало
A fierce warrior with wild red hair and golden eyes, mid-leap wielding a flaming katana, slashing through dark energy, speed lines and dynamic motion blur, dramatic backlighting, shonen anime style --ar 16:9 --s 300 --niji 7
Для аниме переключайся на Niji через --niji 7. Niji понимает аниме-специфичную лексику (shonen, speed lines, dynamic motion blur, backlighting) на родном уровне.
Пример 3
Было
product photograph of watch
Стало
Product photograph of a luxury watch on black marble surface, single overhead softbox light, clean white background, sharp focus, commercial photography --ar 1:1 --s 25 --style raw --v 7
Продуктовая фотография требует низкого `--s` (25) и `--style raw` — это убирает художественную интерпретацию, которая мешает коммерческому использованию.