Seedance 1.0 Pro: как писать промпты, которые модель понимает
ByteDance · Обновлено:
Seedance 1.0 Pro — полнофункциональная версия первого поколения video-модели ByteDance на платформе 即梦 (Jimeng). Делает 5 или 10 секунд в 720p/1080p, 24fps, принимает текст и одно изображение для Image-to-Video. Сильна в multi-shot с camera switching, но не понимает @-референсы, звук и негативные промпты — это всё появилось в 2.0.
Что умеет 1.0 Pro и чего не умеет
1.0 Pro — это «короткий, быстрый, надёжный» видеогенератор. Длительность жёстко 5 или 10 секунд — никаких 7 или 12. Разрешение 720p или 1080p, FPS всегда 24. На вход — текст или одно изображение для I2V. Pro быстрее 2.0 и стабильнее на простых сценах.
Ограничения первого поколения общие для всей линейки 1.0: нет @-референсов (только одно изображение без префикса), нет Consistency Control между генерациями, нет звукового контроля, нет продления видео, нет тайминг-раскадровки по секундам. Негативные промпты не работают вообще — модель их игнорирует или ломает на них.
Сильная сторона — multi-shot с camera switching: «Cut to», «Camera cut to», «Camera switching» внутри одного 10-секундного клипа работают надёжнее, чем в 1.0 Lite.
- Длительность фиксированная: 5 или 10 секунд
- Разрешение 720p / 1080p, 24fps
- На вход: текст или 1 изображение (I2V)
- Multi-shot с camera switching работает
- Негативные промпты НЕ работают
Структура промпта
Каноническая формула: `[Субъект] + [Действие] + [Сцена] + [Камера] + [Стиль]`. Ядро — субъект, действие, сцена. Камера и стиль усиливают, но не заменяют ядро.
Для Text-to-Video: «Субъект + Движение + Сцена + Камера + Стиль». Для Image-to-Video главное — динамика, а не описание статики: «Субъект + Движение, Фон + Движение, Камера + Движение». Если промпт I2V описывает то, что и так видно на изображении, модель не понимает, что должно двигаться.
Обязательно указывать **fixed camera** для статичной камеры или **non-fixed camera** для любых движений. Без этого модель может выбрать неожиданно. Базовые параметры — разрешение, соотношение сторон, длительность — пишутся в конце: «Non-fixed camera, 720p, 9:16, 5s».
Camera switching и multi-shot
Главная фишка 1.0 Pro по сравнению с Lite — умение переключать кадры внутри одного видео. Ключевые фразы: «Cut to», «Camera cut to», «Camera switching». В 10-секундном клипе можно сделать 2–3 кадра.
Пример из документации: «Panoramic shooting, the model approaches with a smile. Camera switching, close-up of the lower body, the straight design of the pants and the drape of the fabric are highlighted while walking.» Здесь один промпт описывает общий план → переключение → крупный план низа.
При смене сцены через «Cut to» — описывать новую сцену словами после переключения, не оставлять «Cut to.» в воздухе. Между кадрами должна быть логическая связь — иначе модель сделает разрыв.
Наречия интенсивности
Без явного указания интенсивности 1.0 Pro выдаёт «среднее» движение — медленное, плавное, без энергии. Чтобы получить динамику, нужны наречия: fast, intense, large, high frequency, strong, crazy, quickly.
Пример: «car quickly passing by» вместо «car passing by» — даёт реально быструю проездку. «Wings flapping wildly» вместо «wings flapping» — крылья работают на полной мощности. «Crazy fast camera dolly-in» вместо «camera dolly-in» — резкое сближение.
Наречия работают и для камерных движений, и для действий персонажей. Это самый дешёвый способ оживить вялый клип — добавить 2–3 наречия в ключевые моменты.
Типичные ошибки
1. Негативные промпты в 1.0 Pro
«No watermark», «no cartoon», «without blur» модель в 1.0 Pro либо игнорирует, либо ломается на них. Правило: пиши что показывать, не что скрывать. Вместо «не мультяшно» → «photorealistic, film grain». Вместо «без текста» → описывай сцены без поверхностей для текста.
2. @-синтаксис референсов
@image1, @video1, @audio1 — это всё из 2.0. В 1.0 Pro их нет: на вход одно изображение без префикса для I2V, и всё. Если промпт написан с @-синтаксисом, модель воспримет «@image1» как мусор в тексте и качество упадёт.
3. Запрос на 7, 12, 15 секунд
Длительность жёстко 5 или 10 секунд. Никаких промежуточных вариантов. «Сделай 8-секундный клип» либо обрежется до 5, либо растянется до 10 со странным темпом. Если нужно 15 — это уже 2.0 или New.
4. I2V-промпт описывает то, что видно на фото
Если на референсе машина и промпт «красная машина на дороге», модель не понимает, что должно двигаться. I2V-формула: «Субъект + Движение, Фон + Движение, Камера + Движение». Описывай динамику — что разгоняется, что вращается, куда летит свет.
5. Тайминг по секундам в стиле «0-3с / 4-8с»
Тайминг-раскадровка появилась только в 2.0. В 1.0 Pro её нет — модель не парсит «0-3с» и «4-8с» как структуру. Для multi-shot используй «Cut to» и «Camera switching» с описанием каждого кадра.
Примеры до/после
Пример 1
Было
красивая модель в платье ходит
Стало
Full-body shot of a young woman in a long red silk dress walking down a marble corridor. She turns slightly toward the camera with a confident smile. Panoramic shooting, slow tracking shot following her movement. Camera switching, close-up of the dress fabric drape and her hand brushing the silk. Soft natural daylight from tall windows on the right, golden hour warm tones. Non-fixed camera, 1080p, 9:16, 10s.
Главное отличие: чёткие действия глаголами, camera switching между общим и крупным планом, явный «non-fixed camera» и базовые параметры в конце. Это типичный fashion-промпт под сильную сторону 1.0 Pro.
Пример 2
Было
не делай мультяшно, не добавляй текст и водяные знаки
Стало
Cinematic close-up of a steaming espresso cup on a dark wooden table in a softly lit café. Steam rises slowly, light catches the foam surface. Camera slowly orbits around the cup, ending on a side angle that reveals the latte art. Warm tungsten lighting, shallow depth of field, film grain. Non-fixed camera, 1080p, 16:9, 5s.
Негативные промпты в 1.0 Pro не работают вообще. Вместо «не делай мультяшно» — позитивно прописать «cinematic», «film grain», «shallow depth of field». Вместо «не добавляй текст» — описать сцену так, чтобы в ней не было поверхностей для текста.
Пример 3
Было
анимируй моё фото машины
Стало
The sports car quickly accelerates from a standstill on the wet asphalt road. Tires spin briefly, water spray rises from behind. Camera follows from a low rear-tracking angle, then switches to a side shot showing the full car body in motion. Headlights glow in the dim evening light, reflections on the wet road. Non-fixed camera, 1080p, 16:9, 5s.
I2V-промпт должен описывать ДВИЖЕНИЕ, а не машину — она уже видна на референсе. Что разгоняется, как двигается камера, куда летит вода, что отражается на мокром асфальте. Наречие «quickly» спасает от вялой проездки.