Video

Kling: как писать промпты, которые модель понимает

Kuaishou · Обновлено:

Kling — семейство видеомоделей от Kuaishou, доступное через klingai.com. Генерирует видео до 10 секунд (до 15 секунд в Kling 3.0), поддерживает T2V, I2V и Motion Control. Промпт принимает до ~2500 символов, оптимальная длина 50–150 слов. Английский даёт самые стабильные результаты; есть поддержка негативного промпта.

Что умеет Kling

Kling — это text-to-video и image-to-video модель, ориентированная на кинематографические сцены и продуктовый контент. Стандартная длительность — 5–10 секунд (15 секунд в Kling 3.0), разрешение до 1080p, поддерживаются Elements — до 4 референсных изображений для консистентности персонажей и объектов.

Режим Motion Control переносит движения из референсного видео на нового персонажа из изображения — основа для AI-инфлюенсеров, виртуальных презентаторов и танцевальных перформансов. Негативный промпт поддерживается как отдельное поле — это принципиальное отличие от Imagen и многих других моделей. Поддерживаются также Keyframes (ровно 2 опорных кадра).

  • T2V до 10 секунд (15 в Kling 3.0), разрешение до 1080p
  • Image-to-Video для оживления статичных изображений
  • Motion Control: перенос движений с референсного видео
  • Elements — до 4 референсов для консистентности
  • Негативный промпт как отдельное поле

Структура промпта

Оптимальная структура для T2V: [Subject/Character] + [Action/Motion] + [Scene/Environment] + [Camera Movement] + [Style/Mood/Lighting]. Порядок важен — модель сильнее учитывает элементы в начале промпта. Самое важное всегда первым.

Каждый блок требует конкретики: «35-year-old woman with shoulder-length auburn hair wearing an emerald green coat» вместо «a person»; «walking purposefully through fallen leaves» вместо «moving around»; «smooth tracking shot following from the side» вместо отсутствия камеры. Среду ограничивай 3–4 элементами — больше десяти приводит к перегрузке и потере фокуса. Оптимальная длина 50–150 слов.

Режимы T2V, I2V и Motion Control

Каждый режим требует своей стратегии. T2V — описывай ВСЁ: субъект, действие, среду, камеру, стиль. Формула: (Субъект + детали) + (Действие + темп) + (Среда + освещение) + (Камера) + (Стиль).

I2V — описывай ТОЛЬКО движение, не сцену. Модель уже видит изображение. Формула: (Движение субъекта) + (Движение среды) + (Камера). Длина 20–40 слов. Описание того, что уже на картинке, — антипаттерн.

Motion Control — описывай ТОЛЬКО внешность персонажа и окружение. Движения берутся из референсного видео автоматически. Формула: [Стиль персонажа + одежда] + [Среда/фон] + [Визуальное качество]. Инструкции по движениям, жестам, мимике в Motion Control — главный антипаттерн.

Типичные ошибки

  1. 1. Описание сцены в I2V-промпте

    В Image-to-Video модель уже видит исходное изображение. Описание внешности персонажа, одежды, окружения — пустые токены, которые модель игнорирует или из-за которых конфликтует с реальной картинкой. I2V-промпт должен быть 20–40 слов и описывать ТОЛЬКО движение и эволюцию сцены.

  2. 2. Инструкции по движению в Motion Control

    Motion Control переносит движения из референсного видео автоматически. Фразы «character dances», «waves hand», «walks forward» в промпте либо игнорируются, либо конфликтуют с движениями из видео. Промпт = арт-дирекция (как выглядит), а НЕ режиссура движения (как двигается).

  3. 3. Конфликтующие камерные движения

    «360-degree rotation around subject while zooming in and panning left» — три одновременные трансформации почти гарантированно вызывают деформацию геометрии. Используй одно основное движение камеры за раз: либо орбита, либо zoom, либо pan. Для сложных переходов лучше Multi-shot в Kling 3.0.

  4. 4. Слишком короткий или абстрактный промпт

    Промпт меньше 15 слов оставляет модели слишком много свободы — она «додумывает» сцену по-своему. Абстрактные формулировки вроде «something beautiful happens», «make it look dynamic», «cool vibes» не дают визуальных якорей. Конкретные детали и физические действия дают модели опору.

  5. 5. Негативные формулировки в основном промпте

    Kling поддерживает negative prompt как отдельное поле — но не в основном промпте. «No people, no text, not blurry» внутри основного промпта либо игнорируется, либо приводит к обратному эффекту. Переноси нежелательные элементы в специальное поле негативного промпта.

Примеры до/после

Пример 1

Было

машина едет по городу на закате

Стало

A sleek silver sports car with chrome wheels accelerates through a rain-slicked downtown street as golden sunset light breaks through storm clouds, camera tracking alongside at street level, smooth dolly motion, cinematic lighting with volumetric light rays reflecting off wet asphalt, photorealistic rendering, shot on virtual anamorphic lens, 24mm, f/2.8, warm color grading with deep contrast.

Главные изменения: конкретные детали машины, состояние улицы, поведение камеры отдельно от субъекта, кинематографический стек, темпоральный маркер для ритма.

Пример 2

Было

I2V для фото девушки на пляже: «девушка идёт к морю»

Стало

Walks slowly toward the ocean, hair and clothing moving gently in the breeze, waves rolling onto shore in the background, camera slowly pushes in

I2V короткий (20–40 слов) и описывает ТОЛЬКО движение: что делает субъект, что в среде, как двигается камера. Описание внешности или сцены было бы антипаттерном — модель уже видит изображение.

Пример 3

Было

Motion Control для танцевального видео: «персонаж танцует»

Стало

Style the character as a confident urban dancer wearing oversized black streetwear and white sneakers, placed in a moody underground parking lot with flickering fluorescent lights and concrete walls, cinematic realism with grainy 35mm film aesthetic, high contrast color grading, shallow depth of field with bokeh on background lights.

Motion Control описывает ВНЕШНОСТЬ и ОКРУЖЕНИЕ, не движения. Танец и тайминг берутся из референсного видео. Инструкции вроде «dances energetically» здесь — главный антипаттерн.

Частые вопросы

Какая длительность видео доступна в Kling?
Стандартная длительность — 5–10 секунд для большинства версий (Kling 1.6, Kling 2.0, Kling 2.6 Pro, Kling O1). Kling 3.0 расширяет потолок до 15 секунд и добавляет режим Multi-shot — до 6 шотов в одной генерации с нарративным развитием. Для длинных видео лучше использовать Kling 3.0 или склеивать несколько генераций в монтаже.
Как работает Image-to-Video в Kling?
В I2V модель получает статичное изображение и оживляет его. Ключевое правило — описывать ТОЛЬКО движение и эволюцию сцены, не описывать то, что уже видно на картинке. Длина 20–40 слов. Формула: (движение субъекта + темп) + (движение среды) + (поведение камеры). Описание внешности или окружения внутри I2V-промпта — антипаттерн, ведущий к конфликтам с изображением.
Чем Motion Control отличается от обычного T2V?
В T2V промпт описывает ВСЁ — субъект, действия, движения, камеру, среду, стиль. В Motion Control движения, жесты, мимика, тайминг берутся из референсного видео автоматически; промпт описывает ТОЛЬКО внешность персонажа и окружение. Это принципиально другая стратегия: промпт = арт-дирекция, не режиссура движения. Оптимальная длина 30–80 слов.
Зачем нужен Elements и сколько референсов брать?
Elements — режим с референсными изображениями для консистентности персонажей и объектов в видео. Оптимально 2–4 качественных референса с разных ракурсов. Более 4 — модель путается в приоритетах и начинает смешивать черты. Применение: повторяющиеся персонажи в серии видео, брендированный контент, нарративы с консистентным героем.
Можно ли писать промпты на русском?
Можно, но качество ниже. Kling обучен на мультиязычных данных, однако английский даёт наиболее стабильные результаты — особенно для кинематографической лексики и описаний камерных движений. Для production-задач переводи промпт на английский, для экспериментов и быстрых тестов русский допустим, но не оптимален.
Как использовать негативный промпт?
Негативный промпт в Kling — отдельное поле, не часть основного промпта. Туда выноси нежелательные элементы: «No people, no text overlays, no distortion in vehicle proportions», «No watermark, no logos, no extra limbs». Это страховка от частых артефактов: лишние люди в продуктовом шоте, водяные знаки, искажения геометрии. Не дублируй негативные формулировки в основной промпт — они там не работают.
Поддерживается ли Opten для Kling?
Да, расширение Opten автоматически распознаёт Kling и его режимы (T2V, I2V, Motion Control, Elements) внутри klingai.com. Для каждого режима применяется своя стратегия оценки: для T2V — полный 5-компонентный чек-лист, для I2V — фокус на движении и коротком промпте, для Motion Control — проверка отсутствия инструкций по движениям. Одним кликом можно получить rewrite в правильной структуре.

Похожие модели

Готов писать промпты для Kling (общий) в один клик?

  • Автоопределение модели прямо в её интерфейсе
  • Скоринг каждой строки промпта
  • Rewrite по правильной структуре одной кнопкой
ChromeYandex BrowserChrome / Yandex BrowserУстановить расширение

Pro — $2.99/мес или 199 ₽/мес · отмена в любое время