Image

Seedream 4.5: как писать промпты, которые модель понимает

ByteDance · Обновлено:

Seedream 4.5 — мейнстрим-версия image-модели ByteDance. Делает text-to-image, image-to-image и multi-image blending до 4K. Оптимальная длина промпта 30–100 слов. Доступна через fal.ai, YouMind, flux-ai.io. Принесла читаемый рендеринг текста, пространственное понимание сцен и точное следование сложным инструкциям — главный production-выбор линейки.

Что нового в 4.5 по сравнению с 4.0

4.5 — это поколенческий скачок над 4.0 по всем направлениям. Превосходная эстетика с проработанным светом и тенями, высокая консистентность сложных сцен, точное следование сложным промптам с визуальным контролем.

Ключевые апгрейды: пространственное понимание (реалистичные пропорции, размещение объектов, компоновка), богатые мировые знания (научное и техническое обоснование), читаемый рендеринг текста на изображениях (постеры, вывески, инфографика), и multi-image blending — смешивание нескольких референсных изображений в один результат.

Разрешение поднято до 4K (в 4.0 — до 2K). Поддержка editing endpoint — inpainting и модификации существующих изображений работают точно, а не «возьми как стартовую точку».

  • Text-to-Image, Image-to-Image, Multi-Image Blending
  • Разрешение до 4K (vs 2K в 4.0)
  • Оптимальная длина промпта 30–100 слов
  • Точный рендеринг читаемого текста
  • Editing endpoint (inpainting, точные модификации)

Структура промпта

Каноническая формула: `[Субъект] + [Стиль] + [Композиция] + [Освещение/Атмосфера] + [Технические параметры]`. Иерархия приоритизации та же, что в 4.0 — субъект всегда первый.

Но 4.5 справляется с куда более детализированными промптами без потери фокуса. Можно безопасно писать 60–100 слов с конкретикой по каждому уровню — модель удерживает все элементы.

Пример: «A young woman in soft natural light, photorealistic portrait style, 85mm lens, shallow depth of field, subtle expression, smooth bokeh background, clean composition, --ar 4:5.» — это 28 слов, заполнены все пять уровней иерархии. На такой промпт 4.5 даёт стабильно production-качество.

Рендеринг текста

Главный апгрейд 4.5 — читаемый текст в изображении. Постеры с заголовками, вывески, инфографика, упаковка — всё что было слабой зоной 4.0, теперь работает.

Правила те же, что в других моделях с in-image text: точный текст в кавычках («text "BEYOND THE STARS"»), указан стиль шрифта («bold metallic sans-serif»), указано расположение («centered at top», «bottom left corner»), указан формат («--ar 2:3» для постера).

Для длинных строк — разбивай на отдельные элементы. «Movie poster, text "BEYOND THE STARS" centered at top, subtitle "a journey beyond imagination" at bottom» работает лучше, чем одна длинная строка. Латиница даёт самые стабильные результаты; кириллица читаемая, но менее точная.

Multi-Image Blending

Уникальная для 4.5 возможность — смешивание двух референсных изображений в один результат. Шаги: 1) подготовить базовые изображения; 2) загрузить два изображения для смешивания; 3) написать описание желаемого результата; 4) указать, какие стилевые элементы сохранить из каждого источника.

Типичный сценарий: персонаж с одного фото + сеттинг с другого. «Take the character from image 1 and place them in the environment from image 2. Preserve the character's exact facial features and wardrobe from image 1. Use the lighting and atmosphere from image 2.»

Другой сценарий: смешение двух стилей. «Blend the colour palette of image 1 with the composition style of image 2.» — модель синтезирует промежуточный визуал. Это сильнее, чем style transfer — модель действительно понимает, что взять из каждого референса.

Типичные ошибки

  1. 1. Использование 4.5 как «быстрого» 5

    5 Lite лучше во всём, но 4.5 — production-стандарт линейки на момент релиза. Не пытайся писать промпт по правилам 5 (120 слов, расширенные стили, улучшенная анатомия) на 4.5 — модель потеряет фокус. Оптимум для 4.5 — 30–100 слов, и придерживайся стандартного набора стилей.

  2. 2. Multi-Image Blending без явного preserve-списка

    При смешивании двух изображений нужно явно указать, что брать из каждого. «Возьми персонажа из image 1 и помести в сцену из image 2» — слишком абстрактно. Правильно: «Preserve the person's exact facial features, wardrobe, and pose from image 1. Use the lighting and color palette from image 2.»

  3. 3. Длинный текст в одной строке

    Постер с одной длинной строкой («text "BEYOND THE STARS A JOURNEY BEYOND IMAGINATION"») 4.5 рендерит хуже, чем разбитый на части. Лучше: «text "BEYOND THE STARS" centered at top, subtitle "a journey beyond imagination" at bottom». Длинные строки модель может исказить даже на 4.5.

  4. 4. Негативы в основном тексте

    Как и в 4.0, на 4.5 негативные промпты пишутся в отдельное поле platform negative_prompt, не в основной текст. «No watermark, no text» в основном промпте — антипаттерн, модель может добавить водяной знак. Используй отдельное поле или переформулируй позитивно.

  5. 5. Конфликтующие стили

    «Photorealistic oil painting cartoon» работает на 4.5 чуть лучше, чем на 4.0, но всё равно даёт непредсказуемый результат. Выбирай один доминирующий стиль и максимум один совместимый модификатор. «Cinematic with film grain», «photorealistic with subtle painterly touches» — ок. «Realistic anime» — нет.

Примеры до/после

Пример 1

Было

красивая фотография еды для меню ресторана

Стало

Bowl of artisan ramen with soft-boiled egg, sliced pork belly, and fresh green onions on a dark stone surface, food photography, soft overhead lighting from the upper-left, steam rising from the bowl, shallow depth of field with sharp focus on the egg yolk, warm earthy color palette, close-up overhead angle, --ar 1:1.

Конкретный субъект (что именно в кадре), food photography стиль, явное освещение с направлением, композиция overhead, depth of field. 50 слов — рабочая длина для 4.5. На таком уровне детализации 4.5 даёт почти production-ready результат.

Пример 2

Было

постер фильма с заголовком и атмосферой ужаса

Стало

Horror movie poster with text "THE LAST NIGHT" in bold weathered sans-serif typography centered at the upper third, dark abandoned hallway receding into shadow, single bare bulb hanging from the ceiling, dramatic low-key lighting with hard shadows, cold blue-grey color palette with one accent of red light at the far end, subtle film grain, cinematic 35mm aesthetic, --ar 2:3.

Текст в кавычках, явный стиль шрифта, явное расположение в кадре. Сцена с пространственным пониманием (коридор, лампа, дальний красный акцент). Это то, что в 4.0 ломается, а в 4.5 работает.

Пример 3

Было

смешай моё фото с пейзажем как фон

Стало

Take the person from image 1 and place them in the mountain landscape from image 2. Preserve the person's exact facial features, wardrobe, and pose from image 1. Use the lighting, atmosphere, and golden hour color palette from image 2. Match the scale so the person stands naturally in the mid-ground, with the mountain peaks rising behind them. Cinematic style, shallow depth of field, --ar 16:9.

Multi-Image Blending промпт: явно сказано, что взять из image 1 (внешность, одежда, поза), что взять из image 2 (свет, атмосфера, палитра), плюс инструкция по масштабу и расположению. Без явного preserve-списка модель может «улучшить» лицо или изменить одежду.

Частые вопросы

Чем 4.5 отличается от 4.0?
Шесть ключевых апгрейдов: превосходная эстетика с детальным светом и тенями, читаемый рендеринг текста в изображениях, пространственное понимание сцен с несколькими объектами, точное следование сложным промптам, разрешение до 4K (vs 2K в 4.0), и multi-image blending. Для production-задач 4.5 — однозначный выбор; 4.0 остаётся для быстрых дешёвых базовых шотов.
Чем 4.5 отличается от 5 Lite?
5 Lite дальше расширил возможности 4.5: ещё более точный текст, улучшенная анатомия рук, более широкий диапазон стилей, поддержка длинных промптов до 120 слов, лучшее пространственное понимание. Но 4.5 — стабильный production-стандарт линейки, и для большинства задач разница между 4.5 и 5 Lite минимальна. Используй ту, что доступна на платформе.
Как использовать multi-image blending правильно?
Три ключевых элемента: 1) явно сказать, что взять из каждого референса (внешность, поза, свет, палитра); 2) указать, как объединить (соблюсти масштаб, поместить в передний/задний план, сохранить пропорции); 3) описать желаемый результат стилистически. Без явного preserve-списка модель может «улучшить» лицо или изменить одежду — критичная зона для портретов.
Какой максимальный размер изображения?
До 4K. Это шаг вперёд от 4.0 (до 2K). Соотношение сторон — стандартные 1:1, 2:3, 3:4, 4:3, 3:2, 16:9, 9:16 плюс произвольные через --ar. Для постеров — --ar 2:3 (вертикальный) или --ar 3:2 (горизонтальный). Для портретной фотографии в соцсетях — --ar 4:5. Для пейзажей и кинематографа — --ar 16:9.
Как использовать editing endpoint в 4.5?
Editing endpoint — это inpainting и точные модификации существующих изображений. Шаги: 1) загрузить базовое изображение; 2) указать маску области для редактирования (на платформе типа fal.ai это отдельный UI-элемент); 3) написать промпт того, что должно появиться в маске. В отличие от 4.0, где «возьми как стартовую точку» — здесь точная замена области с сохранением остального.
Какие стили работают лучше всего на 4.5?
Стабильно сильные зоны: photorealistic portrait и cinematic photography (отличное лицо и освещение), fashion editorial (контроль ткани и драпировки), commercial product photography (чёткие материалы), concept art / digital painting (эпический масштаб с volumetric light), architectural visualization (точные пропорции). Слабые зоны (для них лучше 5 Lite) — комиксы и manga со сложной анатомией рук.
Поддерживается ли Opten для Seedream 4.5?
Да, расширение Opten распознаёт Seedream 4.5 внутри fal.ai, YouMind и flux-ai.io. Оценивает промпт по структуре production-версии: проверяет субъект в начале, наличие явного стиля, корректность освещения, разделение позитива и негатива, кавычки вокруг текста, корректную структуру multi-image blending. Одним кликом получишь rewrite, использующий все возможности 4.5.

Похожие модели

Готов писать промпты для Seedream 4.5 в один клик?

  • Автоопределение модели прямо в её интерфейсе
  • Скоринг каждой строки промпта
  • Rewrite по правильной структуре одной кнопкой
ChromeYandex BrowserChrome / Yandex BrowserУстановить расширение

Pro — $2.99/мес или 199 ₽/мес · отмена в любое время