Seedance 1.5 Pro: как писать промпты, которые модель понимает
ByteDance · Обновлено:
Seedance 1.5 Pro — промежуточная версия видео-модели ByteDance между поколениями 1.0 и 2.0. Делает 5 или 10 секунд до 1080p, принимает текст и 1–2 изображения. Принесла базовую поддержку negative prompts, простую раскадровку «начало/середина/конец» и расширенный камерный словарь — но без полных @-референсов, звука и точного тайминга по секундам из 2.0.
Место 1.5 Pro в линейке
1.5 Pro — это «1.0 на стероидах»: та же фиксированная длительность 5/10 секунд, тот же отсутствующий звук, но заметно улучшенная физика движений, лучшее следование промптам и базовая поддержка референс-изображений (1–2 штуки) для сохранения стиля.
Ключевое отличие от 1.0 Pro: появилась простая раскадровка («Start / Middle / End») и базовая поддержка негативных промптов на уровне простых запретов. Камерный словарь расширен — теперь стабильно работают комбинации orbit + zoom (не более двух одновременных движений).
От 2.0 отделяет: нет тайминг-раскадровки по секундам, нет полного @-синтаксиса с множественными референсами, нет звукового контроля, разрешение ограничено 1080p (в 2.0 — до 2K).
- Длительность 5 или 10 секунд (как в 1.0)
- Разрешение до 1080p, 24fps
- На вход: текст + 1–2 изображения (базовый reference)
- Простая раскадровка Start / Middle / End
- Базовые negative prompts работают, сложные — нет
Структура промпта
Базовая формула та же, что в 1.0 Pro: `[Субъект] + [Действие] + [Сцена] + [Камера] + [Стиль]`. Но 1.5 Pro лучше обрабатывает детализированные промпты — можно безопасно расписывать внешность, материалы, освещение в большем объёме.
Для Text-to-Video: «Субъект + Движение + Сцена + Камера + Стиль/Настроение». Для Image-to-Video: «Субъект + Движение, Фон + Движение, Камера + Движение + Стиль». Базовые параметры в конце: «Non-fixed camera, 1080p, 16:9, 10s».
Для 10-секундных видео используй простую раскадровку — это сильная сторона 1.5: «Start: woman sits at a café table, reading a book. Medium shot. Middle: she looks up, sees someone, smiles. Camera slowly zooms in. End: close-up of her face, warm smile, golden hour light.»
Простая раскадровка Start / Middle / End
1.5 Pro вводит трёхактную структуру без жёсткого тайминга по секундам. Это даёт базовый контроль над нарративом без сложности 2.0.
Каждый блок описывает: что в кадре, какая камера, какое освещение. Между блоками модель сама расставит переходы — не нужно прописывать «cut to» или «camera switching».
Пример: «Start: detective sits at his desk, dim light, medium shot. Middle: phone rings, he picks it up, camera slowly pushes in. End: close-up of his eyes widening as he hears the news, warm desk lamp catches one side of his face.» Это работает надёжнее, чем сплошной параграф — модель видит трёхактную структуру и распределяет движение во времени осмысленно.
Базовые negative prompts
1.5 Pro принимает простые запреты — но не сложные конструкции. Что работает: «No text, no watermarks», «No cartoon style», «No blurry details». Что не работает: длинные негативные списки, негативные описания персонажей, противоречивые ограничения.
Лучший подход: всё, что можно, формулировать позитивно («photorealistic», «sharp focus», «cinematic»), а в negative оставлять только базовые исключения. Несколько простых запретов в одной строке: «No text. No watermarks. No motion blur.» — рабочий формат.
Конфликт между негативом и основным промптом — антипаттерн. Если в промпте написано «detective with a mustache», а в negative — «no facial hair», модель сломается. Сначала привести промпт к непротиворечивому виду, потом добавлять negative.
Типичные ошибки
1. Тайминг по секундам в стиле 2.0
«0-3с: X, 4-7с: Y» не работает в 1.5 Pro — точная тайминг-раскадровка появилась только в 2.0. Вместо этого — простая Start / Middle / End раскадровка. Если пользователь привык писать тайминг по секундам, преобразуй в трёхактную структуру.
2. Полный @-синтаксис из 2.0
@image1, @image2, @video1, @audio1 не работают в 1.5 Pro. Поддерживается базовый reference на 1–2 изображения без префикса. Если промпт содержит множественные @-теги — модель воспримет их как мусор, и качество резко упадёт.
3. Сложные негативные списки
«No text. No watermarks. No motion blur.» — рабочий формат. А вот длинные списки из 10+ запретов или сложные конструкции вроде «no facial hair on a man who has stubble» ломают генерацию. Держи negative коротким и непротиворечивым с основным промптом.
4. Три и больше одновременных камерных движения
Orbit + zoom — работает. Orbit + zoom + pan — модель захлёбывается. Лимит 1.5 Pro — две одновременные операции с камерой. Если нужен сложный кадр — разбей на этапы через Start / Middle / End («Start: orbit. Middle: zoom in. End: pan right.»).
5. Запрос звука или диалогов
Звуковой контроль появился в 2.0 — в 1.5 Pro его нет. «Add dialogue "Hello"», «with epic music», «sound of footsteps» — модель просто игнорирует эти инструкции. Видео получится беззвучным; озвучку добавлять отдельно в монтаже.
Примеры до/после
Пример 1
Было
девушка идёт по улице и улыбается
Стало
Start: a young woman in a beige trench coat walks down a rainy Parisian street, medium shot, soft overcast daylight, reflections on wet cobblestones. Middle: she notices something off camera and slows down, camera pushes in slightly, her expression shifts to gentle curiosity. End: close-up of her face breaking into a quiet smile, golden hour light just starting to cut through the clouds. Cinematic, 35mm lens, film grain, shallow depth of field. Non-fixed camera, 1080p, 16:9, 10s.
Главное отличие: трёхактная Start / Middle / End раскадровка вместо сплошного описания. Модель видит структуру и распределяет движение во времени. Камера, освещение и эмоция уточняются от акта к акту.
Пример 2
Было
продуктовый шот часов на столе, обзор со всех сторон
Стало
Luxury silver chronograph watch on a dark walnut surface, soft three-point studio lighting catches the polished case. Camera slowly orbits around the watch over the first 5 seconds, then pushes in for a close-up of the dial and crown over the remaining 5. Subtle reflections on the sapphire crystal, sharp focus on the watch face, smooth depth of field falloff. Commercial product photography aesthetic. No text. No watermarks. Non-fixed camera, 1080p, 16:9, 10s.
Orbit + push in — рабочая комбинация двух камерных движений в 1.5 Pro. Базовые negative «No text. No watermarks.» здесь работают надёжно — это простые запреты, не сложные конструкции.
Пример 3
Было
анимируй фото пейзажа с горами
Стало
Aerial shot, the mountain landscape gradually reveals itself. Start: wide overview of the snow-capped peaks, clouds slowly drifting from left to right. Middle: camera descends and tilts forward, revealing a glacial lake in the valley below, the lake surface ripples gently. End: camera glides above the lake toward a small wooden cabin on the far shore, golden hour light catching the windows. Cinematic, drone aesthetic, 4K-quality, deep focus. Non-fixed camera, 1080p, 16:9, 10s.
I2V здесь даёт пейзаж как стартовый кадр, а промпт целиком описывает дальнейшую динамику: что движется (облака, поверхность озера), как движется камера (descend, tilt forward, glide). Без описания движения 1.5 Pro оставит сцену почти статичной.