Video

Kling 2.6 Pro: как писать промпты, которые модель понимает

Kuaishou · Обновлено:

Kling 2.6 Pro — видеомодель от Kuaishou, доступная на klingai.com. Генерирует клипы до 10 секунд в 1080p, поддерживает T2V, I2V, Elements (до 4 референсов) и Motion Control. Оптимальная длина промпта 50–150 слов, лучше всего работает с английским и принимает negative prompt как отдельное поле.

Что умеет Kling 2.6 Pro

Kling 2.6 Pro — production-инструмент для коротких видео: продуктовые шоты, ландшафтные таймлапсы, корпоративные спикеры, UGC-стиль контент. Длительность до 10 секунд, разрешение до 1080p, четыре режима: Text-to-Video для генерации с нуля, Image-to-Video для оживления статичных кадров, Elements для консистентности персонажей через 2–4 референса, Motion Control для переноса движений с видео-референса.

Негативный промпт идёт отдельным полем — туда выносятся артефакты и нежелательные элементы. Это даёт более чистый контроль, чем у моделей без negative prompt вроде Imagen.

  • Длительность до 10 секунд, разрешение до 1080p
  • Четыре режима: T2V, I2V, Elements, Motion Control
  • Elements — 2–4 референса для консистентности персонажей и объектов
  • Negative prompt как отдельное поле
  • Акцент через ++keyword++ для усиления элементов

Четырёхкомпонентная структура промпта

Оптимальная структура для Kling 2.6 Pro: [Scene Setting] + [Subject Description] + [Motion Directives] + [Stylistic Guidance].

Scene Setting — окружение и освещение. «A sunlit coastal highway with dramatic cliffs on one side and sparkling ocean on the other, golden hour lighting with long shadows».

Subject Description — детальное описание главных объектов. «A sleek red convertible sports car with chrome wheels and leather interior».

Motion Directives — чёткая артикуляция движения. «Camera tracks alongside the car as it drives at moderate speed, then gradually pulls back to reveal the expansive coastline».

Stylistic Guidance — визуальная эстетика. «Cinematic 4K quality, shallow depth of field, vibrant color grading». Главное правило — модель сильнее учитывает начало промпта, важное идёт первым.

I2V и Motion Control: разные стратегии

I2V (Image-to-Video) описывает ТОЛЬКО движение, не сцену. Модель уже видит изображение. Длина 20–40 слов, фокус на том, как сцена оживает: «Camera slowly tracks right while maintaining focus on the central figure, subtle wind animation affecting the subject's hair and clothing, leaves in background sway gently, warm lighting gradually intensifies».

Motion Control переносит движения из референсного видео на персонажа из изображения. Промпт описывает ВНЕШНОСТЬ и ОКРУЖЕНИЕ, не движения. Формула: [Стиль/внешность персонажа] + [Среда/фон] + [Визуальное качество]. Пример: «Make the character appear as a polished corporate presenter in a tailored navy suit, realistic skin texture, professional grooming. Place in a modern office environment with glass walls, soft daylight, and shallow depth of field».

Типичные ошибки

  1. 1. Описание сцены в I2V-промпте

    В Image-to-Video модель уже видит исходное изображение. Описание внешности, одежды, окружения тратит токены и конфликтует с реальной картинкой. I2V-промпт должен быть 20–40 слов и описывать ТОЛЬКО движение и эволюцию сцены — что двигается, как и в каком темпе.

  2. 2. Инструкции по движению в Motion Control

    Motion Control переносит движения из референсного видео автоматически. «Character dances», «waves hand», «walks energetically» в промпте — главный антипаттерн режима. Промпт описывает арт-дирекцию (как выглядит, где находится, какое качество), а не режиссуру движения.

  3. 3. Конфликтующие камерные движения и стили

    «360° rotation + zoom in» — множественные одновременные трансформации вызывают деформацию геометрии. «Golden hour» + «studio lighting» в одном промпте путает стилевую интерпретацию модели. Используй одно основное камерное движение и согласованную светотеневую схему по всему промпту.

  4. 4. Перегрузка среды деталями

    Больше 10 элементов окружения в одном промпте приводит к потере фокуса — модель пытается уместить всё в 10 секунд и упрощает или путает элементы. Оптимально 3–4 ключевых элемента среды с описанием освещения и атмосферы. Лишние детали оставь негативному промпту или Elements.

  5. 5. Важная информация в конце промпта

    Kling 2.6 Pro сильнее учитывает начало промпта. Если главный субъект или ключевое действие зарыты в последнем предложении, модель приоритизирует то, что прочла первым. Выноси главный субъект и сцену в первые 30–50 слов, дальше добавляй стиль и технические детали.

Примеры до/после

Пример 1

Было

красная машина едет по дороге

Стало

A sunlit coastal highway with dramatic cliffs on one side and sparkling ocean on the other, golden hour lighting with long shadows. A ++sleek red convertible sports car++ with chrome wheels and tan leather interior. Camera tracks alongside the car as it drives at moderate speed along the winding road, then gradually pulls back to reveal the expansive coastline. Cinematic 4K quality, shallow depth of field, vibrant color grading, shot on virtual anamorphic lens, 24mm, f/2.8.

Четырёхкомпонентная структура целиком: scene setting, subject description с акцентом через ++, motion directives с темпом, stylistic guidance с техническими маркерами.

Пример 2

Было

I2V для фото с кафе: «человек пьёт кофе»

Стало

Camera slowly tracks right while the woman raises the cup to her lips and takes a slow sip, steam rising gently from the espresso, leaves in background sway in light breeze, warm afternoon light gradually intensifies

I2V короткий (20–40 слов), описывает только движение и эволюцию сцены. Никаких описаний внешности или одежды — модель уже видит изображение.

Пример 3

Было

Motion Control: «спикер презентует продукт»

Стало

Make the character appear as a polished corporate presenter in a tailored navy suit with a crisp white shirt, realistic skin texture, professional grooming, neat short haircut. Place in a modern office environment with floor-to-ceiling glass walls overlooking a city skyline, soft daylight from above, clean minimalist interior. Cinematic realism with shallow depth of field, professional commercial quality.

Motion Control описывает только внешность и среду. Жесты, мимика и позы для презентации берутся из референсного видео. Инструкции «gestures with hands» здесь — антипаттерн.

Частые вопросы

Чем Kling 2.6 Pro отличается от Kling 3.0?
Kling 2.6 Pro генерирует видео до 10 секунд в 1080p и не поддерживает multi-shot и нативный аудио. Kling 3.0 расширяет потолок до 15 секунд, добавляет Multi-shot (до 6 шотов в одной генерации), нативную генерацию диалогов и аудио, и улучшенный кинематографический рендеринг. Для коротких продуктовых клипов 2.6 Pro оптимален; для нарративов с диалогами — 3.0.
Сколько референсов брать в Elements?
Оптимально 2–4 качественных референса персонажа или объекта с разных ракурсов. Один референс работает, но даёт меньше консистентности при поворотах головы и смене угла. Более 4 референсов — модель путается в приоритетах и начинает смешивать черты разных изображений. Лучшее качество — 3 чётких референса с одного освещения и в одном стиле.
Как работает синтаксис ++keyword++?
Двойные плюсы вокруг слова или фразы усиливают её важность в промпте. «++sleek red convertible++ driving along coastal highway» даёт модели сигнал, что машина — центральный элемент кадра. Не злоупотребляй: 1–2 акцента на промпт. Если выделить всё, эффект теряется и модель воспринимает выделения как обычный текст.
Что такое проблема морфинга объектов и как её решать?
Морфинг — это когда объект меняет внешность в середине видео: машина превращается в другую модель, лицо персонажа дрейфует, логотип искажается. Чаще всего проявляется в длинных генерациях. Решения: использовать Elements с референсами объекта с нескольких ракурсов, добавить «maintains exact appearance throughout» в промпт, сократить длительность, упростить движение камеры.
Можно ли писать промпты на русском?
Можно, но качество ниже. Kling 2.6 Pro обучен на мультиязычных данных, однако английский даёт самые стабильные результаты — особенно для кинематографической лексики, описаний камерных движений и стилистических маркеров. Для production-задач переводи промпт на английский. Для черновиков и быстрых тестов русский допустим.
Зачем нужен негативный промпт и что туда писать?
Негативный промпт — отдельное поле, страховка от частых артефактов. Туда выноси: «No people, no text overlays, no distortion in vehicle proportions» для продуктовых шотов; «No watermark, no logos, no extra limbs» для портретов; «No morphing, no shape distortion» для длинных кадров. Не дублируй негативные формулировки в основной промпт — там они либо игнорируются, либо приводят к обратному эффекту.
Поддерживается ли Opten для Kling 2.6 Pro?
Да, расширение Opten автоматически распознаёт Kling 2.6 Pro и его режимы (T2V, I2V, Elements, Motion Control) внутри klingai.com. Для каждого режима применяется своя стратегия оценки: для T2V — четырёхкомпонентная структура, для I2V — короткий промпт о движении, для Motion Control — отсутствие инструкций по движениям. Одним кликом можно получить rewrite в правильной структуре.

Похожие модели

Готов писать промпты для Kling 2.6 Pro в один клик?

  • Автоопределение модели прямо в её интерфейсе
  • Скоринг каждой строки промпта
  • Rewrite по правильной структуре одной кнопкой
ChromeYandex BrowserChrome / Yandex BrowserУстановить расширение

Pro — $2.99/мес или 199 ₽/мес · отмена в любое время