Seedream 4.0: как писать промпты, которые модель понимает
ByteDance · Обновлено:
Seedream 4.0 — базовая версия image-модели ByteDance первого поколения семейства. Делает text-to-image до 2K, оптимальная длина промпта 20–80 слов. Доступна через fal.ai, flux-ai.io. Хорошо справляется с простыми сценами и стандартными жанрами, но слабее версий 4.5 и 5 на сложных многоэлементных сценах и пространственных отношениях.
Где 4.0 в линейке Seedream
Seedream 4.0 — это «надёжный базовый солдат» семейства. Стабильная генерация, предсказуемые результаты на простых промптах, поддержка стандартных стилей и базовое понимание композиции. Это самая дешёвая и быстрая версия линейки.
Чего НЕ умеет 4.0 по сравнению с 4.5 и 5: слабее точное следование сложным инструкциям, хуже пространственное понимание (пропорции, размещение объектов), менее детализированный рендеринг текста на изображениях, меньшая консистентность в сценах с несколькими объектами.
Ключевой совет: для 4.0 используй короткие простые промпты вместо длинных сложных. Где 5 Lite справится с 120-словным многослойным промптом, 4.0 даст лучший результат на 30-словном прямолинейном.
- Text-to-Image, до 2K
- Оптимальная длина промпта 20–80 слов
- Стандартные соотношения сторон через --ar
- Базовое image-to-image (ограниченно)
- Слабый рендеринг сложного текста на изображениях
Структура промпта
Базовая формула: `[Субъект] + [Стиль] + [Композиция] + [Освещение] + [Детали]`. Как и в других версиях Seedream, субъект всегда идёт первым — иерархическая приоритизация общая для всего семейства.
Для 4.0 рекомендуется более простая структура, чем для 4.5/5. Меньше прилагательных, более прямолинейные формулировки, чёткое разделение на уровни. Перегрузка деталями работает хуже, чем в более поздних версиях.
Пример: «A young woman with curly hair, portrait photography, soft studio lighting, neutral background, 85mm lens.» — пять компонентов, ничего лишнего. Это рабочий минимум для 4.0.
Что 4.0 умеет хорошо
Портретная фотография — Subject + appearance + portrait photography + lighting + background. На стандартных портретах 4.0 даёт почти такое же качество, как 4.5.
Пейзажи и сцены — Location + landscape photography + lighting + mood. Природные пейзажи с golden hour, mountain lakes, forests — сильная сторона 4.0.
Продуктовая фотография — product + material + clean background + product photography + studio lighting. Простые продуктовые шоты на белом фоне выходят чисто.
Иллюстрации и арт — subject + style (watercolor, oil painting) + colors + mood. Стилизованные иллюстрации в одном чётком стиле — рабочая зона 4.0.
Кинематографические кадры — scene + character + cinematic + dramatic lighting + lens. Базовые cinematic-кадры доступны, но без сложной хореографии нескольких объектов.
Что 4.0 умеет плохо
Сложный текст на изображениях — это слабая зона 4.0. На постерах с длинными заголовками модель искажает буквы, путает шрифты, добавляет лишние символы. Если нужен качественный рендеринг текста — выбирай 4.5 или 5.
Пространственные отношения между объектами — 4.0 плохо понимает «a cat on the left, a dog on the right, a window between them». Сложные многоэлементные сцены с явным размещением — антипаттерн.
Длинные многослойные промпты — больше 100 слов, и модель теряет фокус. Лучше 80 слов с конкретикой, чем 150 со всем подряд.
Итеративная работа с одной композицией — 4.0 хуже сохраняет одну и ту же сцену между генерациями. Версия больше «лотерейная»: каждая генерация чуть другая.
Типичные ошибки
1. Длинный многослойный промпт
Больше 100 слов в 4.0 — антипаттерн. Модель теряет фокус и приоритеты смещаются. Если в 5 Lite можно расписать длинный детализированный промпт, в 4.0 лучше держать 20–80 слов. Конкретика короткими блоками работает лучше, чем длинное описание.
2. Сложный текст на изображениях
Постеры с длинными заголовками, инфографика с множеством надписей, UI-мокапы с интерфейсом — слабая зона 4.0. Модель искажает буквы, путает шрифты. Если нужен качественный текст в изображении — переключайся на 4.5 или 5 Lite. В 4.0 ограничься короткими словами в кавычках.
3. Сложные пространственные инструкции
«A cat sitting on a chair to the left of a window, with a dog lying on the floor in front of the chair» — 4.0 такие связи не держит. Получишь сцену с этими объектами, но в случайном расположении. Для точной композиции нужна 4.5 или 5.
4. Конфликтующие стили
«Photorealistic cartoon sketch» или «watercolor 3D render» — 4.0 ломается на конфликтах быстрее, чем 4.5/5. Выбирай один доминирующий стиль и максимум один совместимый модификатор. «Photorealistic with film grain» — ок. «Realistic anime» — нет.
5. Негативы в основном тексте
«No watermark, no text, no extra limbs» в основном промпте 4.0 воспримет буквально — может добавить водяной знак. Все запреты идут в отдельное поле negative_prompt платформы. Если оно недоступно — формулируй позитивно: «no cluttered» → «clean background».
Примеры до/после
Пример 1
Было
женщина в офисе
Стало
A young woman with curly brown hair in a beige blazer, working at a wooden desk in a modern office, portrait photography style, soft natural window light from the left, neutral background, 85mm lens, shallow depth of field, --ar 4:5.
Главное отличие: конкретный субъект (волосы, одежда), указан стиль фото, явное освещение и объектив. Это типичный «80-словный» промпт, оптимальный для 4.0 — не перегружен, но содержит все ключевые элементы.
Пример 2
Было
горный пейзаж на закате
Стало
Mountain lake at sunrise, landscape photography, golden hour lighting, snow-capped peaks reflected in calm water, serene atmosphere, wide-angle composition, subtle morning mist, --ar 16:9.
Природный пейзаж с golden hour — сильная сторона 4.0. Промпт намеренно простой и прямолинейный (около 25 слов), без сложных пространственных инструкций.
Пример 3
Было
матовая чёрная кружка на белом фоне
Стало
Matte black ceramic coffee mug on a white background, product photography, soft studio lighting, sharp focus on the mug, clean minimal composition, subtle shadow, --ar 1:1.
Простой e-commerce шот — основная зона 4.0. Один объект, чистый фон, явный стиль, явное освещение. Никаких сложных деталей и нескольких объектов — модель работает быстро и стабильно.