Video

Kling Motion Control: как писать промпты, которые модель понимает

Kuaishou · Обновлено:

Kling Motion Control — режим Kling от Kuaishou для переноса движений с референсного видео на персонажа из изображения. Длительность 5–10 секунд, разрешение до 4K (Kling 3.0), Motion Brush до 6 элементов на кадр. Главное правило: промпт = арт-дирекция (как выглядит), а НЕ режиссура движения (как двигается).

Что такое Kling Motion Control

Motion Control — это НЕ Text-to-Video. Здесь промпт выполняет принципиально другую функцию: движения, жесты, мимика и тайминг берутся из референсного видео или рисуются кистью, а промпт описывает только внешность персонажа и окружение.

Два основных режима. Reference Video Motion Transfer — пользователь загружает референсное видео (3–30 секунд, чёткий субъект, минимальная тряска) и изображение персонажа. Система извлекает скелетную анимацию, тайминг и контактную динамику и применяет к персонажу. Motion Brush — пользователь рисует траектории движения прямо на изображении, до 6 отдельных элементов с индивидуальными траекториями; промпт описывает общую сцену, а не движение.

  • Перенос движений с видео-референса на персонажа из изображения
  • Motion Brush: до 6 элементов с индивидуальными траекториями
  • 6-осевая камера в Kling 3.0: pan, tilt, roll, dolly, truck, pedestal
  • Длительность 5–10 секунд, до 4K (Kling 3.0)
  • Element Binding: фиксация черт лица и идентичности персонажа

Три столпа промпта

Промпт для Motion Control строится из трёх блоков. Внешность персонажа: одежда и стиль (формальный, кэжуал, кинематографический), возрастной диапазон, настроение, детали лица (текстура кожи, выразительные глаза, освещение), общий визуальный тон (реалистичный, стилизованный, полированный).

Окружение: тип среды (студия, офис, город, природа), глубина и освещение (мягкий блюр, малая глубина резкости), атмосфера (профессиональная, уютная, драматичная, минималистичная).

Визуальный стиль и качество: стиль камеры (кинематографический, документальный, соцсети), цветокоррекция (нейтральная, тёплая, контрастная), уровень реализма (фотореалистичный, коммерческий, редакторский). Формула: [Внешность персонажа] + [Среда/фон] + [Визуальный стиль]. Оптимальная длина 30–80 слов.

Главное правило: арт-дирекция, не режиссура движения

Reference Video Transfer переносит движения, жесты, мимику, тайминг АВТОМАТИЧЕСКИ из референсного видео. Описание движений в промпте — главный антипаттерн режима. Фразы «character dances», «waves hand», «walks forward», «smiles then frowns», «at 3 seconds raises hand» либо игнорируются, либо конфликтуют с движениями из видео.

Motion Brush работает аналогично: пользователь РИСУЕТ траектории на изображении, движение задаётся кистью. Промпт описывает общую сцену и атмосферу, а не конкретные движения элементов. Допустимо общее описание динамики («gentle breeze», «flowing water»), но не конкретные инструкции анимации.

Золотое правило одно: промпт = как выглядит, а НЕ как двигается.

Типичные ошибки

  1. 1. Описание движений в промпте

    Главный антипаттерн режима. «The character dances», «waves hand», «walks forward», «turns head left» — движения в Reference Video Transfer берутся из референсного видео автоматически. В Motion Brush — рисуются кистью. Промпт описывает внешность и среду, а НЕ движение тела.

  2. 2. Описание мимики и эмоций как действий

    «Character smiles, then frowns», «expression changes from happy to sad» — мимика и эмоциональные переходы тоже берутся из референсного видео. В промпте можно указать общий эмоциональный тон («friendly expression», «serious demeanor») как часть описания персонажа, но не последовательность смены выражений.

  3. 3. Описание тайминга перформанса

    «At 3 seconds character raises hand», «after 5 seconds turns to camera» — тайминг полностью из референсного видео. Любые временные маркеры в промпте для Motion Control конфликтуют с реальным перформансом и могут привести к артефактам. Тайминг = референс, а не промпт.

  4. 4. Промпт в стиле обычного T2V

    Если писать промпт с действиями, камерными движениями и стилем (как для Text-to-Video), это неправильный режим. T2V-промпт здесь даст худший результат, чем коротко описанная арт-дирекция. Оптимальная длина для Motion Control — 30–80 слов; более длинный промпт обычно содержит лишние инструкции по движению.

  5. 5. Слишком короткий или абстрактный промпт

    Промпт меньше 10 слов оставляет модели слишком мало визуальной информации о персонаже и среде. Абстрактные формулировки «make it look cool», «something dynamic», «professional vibe» не дают опоры. Конкретные детали внешности (одежда, материалы) и среды (тип локации, освещение) обязательны.

Примеры до/после

Пример 1

Было

корпоративный спикер

Стало

Style the character as a polished corporate presenter in a tailored navy suit with a crisp white shirt and minimal silver watch, realistic skin texture with subtle facial details, professional grooming, neat short haircut. Placed in a modern office environment with floor-to-ceiling glass walls overlooking a city skyline, soft natural daylight from above, clean minimalist interior. Cinematic realism with shallow depth of field, professional commercial quality, neutral warm color grading.

Все три столпа: внешность персонажа с конкретными деталями, окружение с глубиной и освещением, визуальное качество. Никаких инструкций по движениям — они из референсного видео.

Пример 2

Было

девушка в стиле UGC

Стало

Turn the character into a casual lifestyle creator wearing soft cream knit sweater and neutral makeup with natural facial details, mid-20s age range, friendly expression. Set against a warm home interior with bookshelf and indoor plants in soft bokeh background, golden afternoon window light, cozy atmosphere. Clean commercial lighting with slightly elevated saturation, social-media UGC aesthetic, smartphone camera feel.

Полная смена контекста персонажа без затрагивания перформанса. Стиль (cream knit, neutral makeup), окружение (home interior, bookshelf, window light), качество (UGC aesthetic) — арт-дирекция в чистом виде.

Пример 3

Было

Motion Brush: «золотое пшеничное поле на закате»

Стало

A golden wheat field under warm sunset light, gentle atmosphere with soft golden hour glow, photorealistic rendering with shallow depth of field, layered composition with distant tree line and pastel orange sky in the background, cinematic color grading with rich amber and ochre tones.

Для Motion Brush промпт описывает сцену и атмосферу, не движение. Колыхание колосьев задаётся пользователем кистью прямо на изображении. Допустимы общие фразы вроде «gentle atmosphere», но не «wheat sways from left to right».

Частые вопросы

Чем Motion Control отличается от обычного T2V в Kling?
В T2V промпт описывает ВСЁ — субъект, действия, движения, камеру, среду, стиль. В Motion Control движения, жесты, мимика, тайминг берутся из референсного видео или задаются кистью; промпт описывает ТОЛЬКО внешность персонажа и окружение. Это принципиально другая стратегия промптинга — арт-дирекция, а не режиссура движения.
Какие требования к референсному видео?
Длительность 3–30 секунд, чёткий субъект (одна центральная фигура), минимальная тряска камеры, хорошее освещение. Сложные ракурсы и быстрая смена положения тела работают, но требуют качественного изображения персонажа. Многофигурные сцены в референсе плохо переносятся — лучше брать видео с одним персонажем. Скелетная анимация извлекается автоматически.
Как работает Motion Brush?
Пользователь загружает статичное изображение и рисует траектории движения прямо на нём. Motion Brush задаёт направление, скорость и дугу для выбранной области; Static Brush фиксирует области, которые НЕ должны двигаться. До 6 отдельных элементов с индивидуальными траекториями. Промпт в этом режиме описывает сцену и атмосферу, не конкретные движения — те заданы кистью.
Что такое Element Binding?
Element Binding в Kling 3.0 — система фиксации черт лица, текстуры кожи и диапазона выражений персонажа по всем кадрам. Гарантирует, что лицо не «дрейфует» при поворотах головы и сменах ракурса. Критично для коммерческих видео с виртуальными презентерами и AI-инфлюенсерами, где идентичность персонажа должна оставаться безупречной в каждом кадре.
Можно ли указать движение камеры в Motion Control?
Да, в Kling 3.0 доступно 6-осевое управление камерой: pan, tilt, roll, dolly, truck, pedestal. Камерное направление в промпте — допустимо: «medium shot with slow dolly in», «close-up holding steady», «wide tracking shot from the side». Это отличается от описания движений тела персонажа — те запрещены, движение камеры разрешено.
Какая оптимальная длина промпта?
30–80 слов. Короче — недостаточно визуальной информации о персонаже и среде. Длиннее — обычно начинаются лишние инструкции по движениям, тайминг или эмоциональные переходы, которые конфликтуют с референсным видео. Сладкая точка — около 50 слов: три блока (внешность, среда, стиль) по 15–20 слов каждый.
Поддерживается ли Opten для Kling Motion Control?
Да, расширение Opten автоматически распознаёт Kling Motion Control внутри klingai.com и применяет специальную стратегию оценки: проверяет отсутствие инструкций по движениям, мимике и таймингу, наличие трёх столпов (внешность, среда, стиль), оптимальную длину 30–80 слов. Если в промпте найдены движения тела — Opten предупредит и предложит rewrite в режиме арт-дирекции.

Похожие модели

Готов писать промпты для Kling Motion Control в один клик?

  • Автоопределение модели прямо в её интерфейсе
  • Скоринг каждой строки промпта
  • Rewrite по правильной структуре одной кнопкой
ChromeYandex BrowserChrome / Yandex BrowserУстановить расширение

Pro — $2.99/мес или 199 ₽/мес · отмена в любое время