Seedream 5 Lite: как писать промпты, которые модель понимает
ByteDance · Обновлено:
Seedream 5 Lite — самая свежая версия image-модели ByteDance. Делает text-to-image, image-to-image, multi-image blending, inpainting и outpainting до 4K+. Оптимальная длина промпта 30–120 слов. Доступна через fal.ai, syntx.ai. Принесла улучшенный рендеринг текста, заметно лучшую анатомию рук и расширенный диапазон стилей по сравнению с 4.5.
Чем 5 Lite отличается от 4.5
5 Lite — это апгрейд по семи направлениям. Более точная генерация текста на изображениях (длинные строки и мелкий кегль работают надёжно). Лучшая работа с анатомией человека — руки, пальцы, позы выходят с меньшим количеством артефактов.
Улучшенная обработка сложных многоэлементных сцен — где 4.5 иногда теряет один объект из пяти, 5 Lite удерживает все. Расширен диапазон поддерживаемых стилей — добавлены 3D-рендеры (Unreal Engine, Octane, ray tracing), новые арт-направления (gouache, charcoal), фото-жанры (underwater).
Лучшее пространственное понимание (точные расстояния и пропорции между объектами). Поддержка длинных промптов до 120 слов без потери фокуса. Полный editing endpoint с inpainting, outpainting и точным image-to-image.
- Text-to-Image, Image-to-Image, Multi-Image Blending, Inpainting, Outpainting
- Разрешение до 4K+
- Оптимальная длина промпта 30–120 слов
- Заметно улучшенная анатомия рук и пальцев
- Расширенный диапазон 3D-рендеров и арт-направлений
Структура промпта
Каноническая формула: `[Субъект] + [Стиль] + [Композиция] + [Освещение/Атмосфера] + [Технические параметры] + [Дополнительные детали]`. Иерархия приоритизации общая для всей линейки — субъект всегда первый.
5 Lite позволяет добавить шестой блок «Дополнительные детали» без потери фокуса. Это могут быть текстуры («fine skin texture detail»), материалы («brushed brass, oiled walnut»), микро-настроение («contemplative expression»). На 4.5 такая детализация могла размыть приоритеты; на 5 Lite модель удерживает всё.
Пример: «A middle-aged man with salt-and-pepper beard, photorealistic portrait, 105mm lens, Rembrandt lighting, dark moody background, contemplative expression, shallow depth of field, fine skin texture detail.» — 25 слов с расширенной детализацией. Это рабочий уровень для 5 Lite.
Расширенный рендеринг текста
Главный апгрейд 5 Lite после анатомии — текст в изображении. То, что в 4.5 было «хорошо», в 5 Lite становится «отлично»: длинные строки, мелкий кегль, сложная типографика, кириллица и CJK.
Правила: текст в кавычках (`text "YOUR TEXT HERE"`), стиль шрифта («bold sans-serif», «elegant serif», «handwritten», «metallic typography»), расположение («centered at top», «bottom left corner», «in the upper third»). Для длинных текстов — разбивать на отдельные элементы.
Что работает на 5 Lite, но не на 4.5: длинные слоганы из 5+ слов в одной строке, мелкие подписи к инфографике, упаковка с боковым текстом, многоязычная типографика на одном постере. По сути, это уровень GPT Image 2 — рендеринг текста перестал быть лотереей.
Анатомия и многоэлементные сцены
Руки и пальцы — слабая зона почти всех image-моделей до 2024 года. В 5 Lite это исправлено: руки, держащие предметы, переплетённые пальцы, жесты — всё это рендерится с заметно меньшим количеством артефактов.
Это открывает сценарии, недоступные в 4.5: фотографии с детальной работой рук (мастер за работой, музыкант с инструментом, повар с ингредиентами), портреты со сложными позами рук (молитва, аплодисменты, объятия), fashion со взаимодействием с одеждой (поправляет рукав, держит сумку).
Многоэлементные сцены — 4.5 иногда «теряет» один из 4–5 объектов или путает их расположение. 5 Lite удерживает все: «A father, mother, and two children sitting around a dinner table, with a dog under the table and a cat on the windowsill» — все шесть субъектов на месте.
Типичные ошибки
1. Промпт слишком короткий для 5 Lite
5 Lite справляется с 30–120 словами. Если давать ему 10–15 слов как 4.0, теряется его преимущество — модель будет додумывать вместо того, чтобы рендерить ровно то, что в промпте. Используй расширенный шестой блок «Дополнительные детали» (текстуры, материалы, микро-настроение) — это рабочая зона 5 Lite.
2. Промпт длиннее 200 слов
Даже у 5 Lite есть предел. 30–120 — оптимум, до 150 — рабочая зона, выше 200 — модель теряет фокус. Если хочется впихнуть всё, лучше разбить на итерации: базовый промпт → генерация → image-to-image с уточнениями на следующем шаге. 5 Lite поддерживает полный editing endpoint, не нужно собирать всё в один промпт.
3. Использование 5 Lite как 4.0
Если приходишь на 5 Lite с промптами уровня 4.0 («simple subject, simple style») — теряется потенциал модели. Используй расширенные стили (3D-рендеры, новые арт-направления), детальную анатомию рук в сценах с людьми, длинные тексты в постерах, многоэлементные сцены. Иначе зачем переходить с 4.0.
4. Негативы в основном тексте
Как и на 4.0 и 4.5, на 5 Lite негативные промпты пишутся в отдельное поле platform negative_prompt. «No watermark, no text» в основном промпте 5 Lite может воспринять буквально — добавит водяной знак. Используй отдельное поле; на платформах вроде fal.ai это явный параметр negative_prompt.
5. Текст без кавычек
Даже на 5 Lite текст для рендеринга — всегда в кавычках. «Add the words Beyond the Horizon» без кавычек модель может исказить или вставить слова в неправильном порядке. Правильно: «text "BEYOND THE HORIZON"». Указывай стиль шрифта и расположение — это критично для длинных строк.
Примеры до/после
Пример 1
Было
повар готовит блюдо
Стало
A chef in a crisp white jacket carefully plating a dish, both hands visible holding a small spoon and a microherb stem, photorealistic portrait, 50mm lens, soft directional light from the kitchen window on the left, warm tungsten accent from above, focused intent expression, shallow depth of field with sharp focus on the plate, fine skin texture and detailed hand anatomy, --ar 4:5.
Сцена с детальной работой рук — основная зона 5 Lite. Указано «both hands visible», конкретные предметы в руках, «detailed hand anatomy». Это то, что на 4.5 ещё ломалось, а на 5 Lite выходит чисто.
Пример 2
Было
обложка книги про путешествия
Стало
Book cover for a travel memoir, title text "BEYOND THE HORIZON" in elegant serif typography centered at the top third, subtitle "a journey across three continents" in smaller sans-serif below the title, author name "ELENA MORI" at the bottom in small caps, vintage photograph of a winding mountain road at golden hour as the background, warm earthy color palette, subtle film grain, --ar 2:3.
Длинный текст в трёх отдельных элементах с разными шрифтами и расположением. На 4.5 это работало частично; на 5 Lite — production-ready. Все три блока читаются и расположены точно.
Пример 3
Было
сюрреалистическая сцена с летающими предметами
Стало
A vintage typewriter floating above a wooden desk, brass keys mid-press as if pressed by an invisible hand, sheets of paper drifting upward around it, photorealistic with surreal touches, 3D render in Octane with ray tracing, dramatic side light from the right casting long shadows, deep blue-grey background, ultra-detailed brass texture, iridescent paper edges catching the light, --ar 16:9.
Расширенный диапазон стилей — 3D render in Octane with ray tracing — работает на 5 Lite буквально. Текстуры «ultra-detailed brass» и «iridescent paper edges» — точные модификаторы, которые 5 Lite понимает.