Как написать промпт для image-to-video?

Начните с исходного кадра: кто или что в нем находится, где стоит субъект, какой фон и свет уже есть. Затем добавьте одно действие, одно движение камеры, длительность и ограничения. Хороший промпт для видео похож на короткий режиссерский бриф, а не на набор красивых тегов.

Почему нейросеть для видео ломает лицо или фон?

Чаще всего в промпте не указано, что нужно сохранить. Модель воспринимает картинку как материал для изменения и может перерисовать лицо, руки, одежду или фон. Добавляйте preserve-блок: сохранить лицо, пропорции, позу, одежду, фон и композицию; изменить только движение и свет.

Как оживить фото через нейросеть без лишних артефактов?

Выберите одну актуальную модель под задачу: Kling 3.0 часто удобен для коротких image-to-video клипов с людьми, Veo 3.1 - для клипов с аудио и плавным движением, Seedance 2.0 или Seedance New - для сцен с референсами и таймингом. Затем зафиксируйте, что должно остаться неизменным: лицо, руки, одежда, фон, композиция и количество пальцев.

Какое движение камеры лучше задавать для короткого ролика?

Самые надежные варианты - медленный наезд, легкий отъезд, плавная панорама или статичная пауза с движением внутри сцены. Для 4-6 секунд не стоит смешивать несколько движений. Чем проще траектория камеры, тем стабильнее image-to-video результат.

Сколько текста можно оставлять на скрине или в кадре?

Для обучающих скринов оставляйте крупные короткие слова и дублируйте смысл в тексте статьи и alt. В самом ролике лучше избегать мелкого текста: image-to-video модели могут смазывать буквы между кадрами, особенно при движении камеры.

Гайд

Нейросеть для видео: промпт image-to-video

Влад Воронежцев · 26 мая 2026 г. · Обновлено: 27 мая 2026 г. · 7 мин чтения

Обложка гайда про нейросеть для видео и промпты image-to-video

Нейросеть для видео превращает статичную картинку в короткий ролик: это практический ответ на задачу «как оживить фото через нейросеть». Рабочий image-to-video запрос описывает исходный кадр, движение камеры, действие, свет, темп и ограничения. Если эти блоки заданы явно, Kling 3.0, Veo 3.1 и Seedance 2.0 меньше ломают лица, фон и композицию.

1.
Опишите исходный кадр и будущий ролик
Генерация видео по картинке начинается не с команды «сделай красиво», а с описания того, что уже есть в кадре и что должно измениться во времени. В первом предложении назовите субъект, фон, состояние сцены и желаемый результат: короткий продуктовый клип, атмосферный establishing shot, плавный портретный кадр или динамичный фрагмент для соцсетей. Такой промпт для видео дает модели опору: она понимает, какие элементы нужно сохранить, а какие можно анимировать.
Было
```
Оживи это изображение, сделай кинематографично.
```
Стало
```
Image-to-video: сохранить композицию исходного кадра. Герой стоит на мокрой дороге у гор. Сделать короткий 5-секундный ролик: ветер двигает куртку, облака медленно расходятся, камера слегка приближается.
```
2.
Разложите промпт на сцену, героя, свет и темп
Сильный image-to-video промпт состоит из четырех понятных блоков: сцена, герой, свет и темп. Сцена отвечает за фон и атмосферу, герой - за главный объект и его действие, свет - за настроение и читаемость кадра, темп - за скорость изменений. В Kling 3.0 такой разбор заметен на multi-shot и портретах, в Veo 3.1 - на image-to-video с нативным звуком, в Seedance 2.0 - на длинных сценах с референсами и таймингом. Если один блок пропущен, видеомодель сама додумывает его, и ролик часто уходит в лишнюю драму, хаотичную камеру или резкие изменения лица.
Было
```
Девушка на улице, видео, красиво, реалистично.
```
Стало
```
Сцена: тихая вечерняя улица после дождя. Герой: девушка в светлом плаще идет вперед и смотрит в сторону. Свет: мягкие витрины, отражения на асфальте. Темп: медленно, без резких скачков.
```
3.
Задайте одно движение камеры
Для короткого ролика лучше работает одно движение камеры: наезд, отъезд, облет, плавная панорама или статичная пауза. Комбинация «наезд + облет + дрон + резкий зум» почти всегда провоцирует дрожь и разрывы между кадрами. Укажите не только движение, но и запрет: без тряски, без смены ракурса, без внезапного монтажа. Так нейросеть для видео держит композицию стабильнее.
Было
```
Камера летит вокруг, приближается, потом резко уходит вверх.
```
Стало
```
Камера: медленный наезд на 10%, уровень глаз, без вращения. Сохранить горизонт и положение героя. Без тряски, без смены объектива, без склеек.
```
4.
Проверьте лицо, руки, фон и темп перед рендером
Перед запуском финальной генерации проверьте четыре риска: лицо, руки, фон и темп. В реальном тесте для короткого fashion-кадра Kling 3.0 первый рендер дал шесть пальцев на руке, а повтор с ограничением `preserve finger count, keep both hands anatomically correct` убрал артефакт без смены позы. Для людей явно просите сохранять черты лица, количество пальцев и пропорции тела. Для предметов фиксируйте форму, логотипы лучше не добавлять в кадр мелким текстом, а для фона запрещайте появление новых объектов. Отдельно задайте длительность: 4-6 секунд обычно безопаснее, чем длинный ролик с большим числом событий.
Было
```
Сделай 12 секунд, пусть персонаж идет, машет рукой, камера меняет ракурс, фон оживает.
```
Стало
```
Длительность 5 секунд. Сохранить лицо, руки, одежду и фон. Движение только одно: герой делает полшага вперед, ткань слегка колышется. Без новых людей, без деформации рук, без смены сцены.
```

Нейросеть для видео: промпт image-to-video

Опишите исходный кадр и будущий ролик

Разложите промпт на сцену, героя, свет и темп

Задайте одно движение камеры

Проверьте лицо, руки, фон и темп перед рендером

Частые вопросы

Похожие статьи

Как писать промпты для GPT Image 2: 5 шагов от случайной генерации к точному результату