Нейросеть для видео: промпт image-to-video
Влад Воронежцев · · Обновлено: · 7 мин чтения

Нейросеть для видео превращает статичную картинку в короткий ролик: это практический ответ на запрос «как оживить фото нейросетью». Рабочий image-to-video запрос описывает исходный кадр, движение камеры, действие, свет, темп и ограничения. Если эти блоки заданы явно, Kling 3.0, Veo 3.1 и Seedance 2.0 меньше ломают лица, фон и композицию.
- 1.
Опишите исходный кадр и будущий ролик
Генерация видео по картинке начинается не с команды «сделай красиво», а с описания того, что уже есть в кадре и что должно измениться во времени. В первом предложении назовите субъект, фон, состояние сцены и желаемый результат: короткий продуктовый клип, атмосферный establishing shot, плавный портретный кадр или динамичный фрагмент для соцсетей. Такой промпт для видео дает модели опору: она понимает, какие элементы нужно сохранить, а какие можно анимировать.
Было
Оживи это изображение, сделай кинематографично.
Стало
Image-to-video: сохранить композицию исходного кадра. Герой стоит на мокрой дороге у гор. Сделать короткий 5-секундный ролик: ветер двигает куртку, облака медленно расходятся, камера слегка приближается.

- 2.
Разложите промпт на сцену, героя, свет и темп
Сильный image-to-video промпт состоит из четырех понятных блоков: сцена, герой, свет и темп. Сцена отвечает за фон и атмосферу, герой - за главный объект и его действие, свет - за настроение и читаемость кадра, темп - за скорость изменений. В Kling 3.0 такой разбор заметен на multi-shot и портретах, в Veo 3.1 - на image-to-video с нативным звуком, в Seedance 2.0 - на длинных сценах с референсами и таймингом. Если один блок пропущен, AI video generator сам додумывает его, и ролик часто уходит в лишнюю драму, хаотичную камеру или резкие изменения лица.
Было
Девушка на улице, видео, красиво, реалистично.
Стало
Сцена: тихая вечерняя улица после дождя. Герой: девушка в светлом плаще идет вперед и смотрит в сторону. Свет: мягкие витрины, отражения на асфальте. Темп: медленно, без резких скачков.

- 3.
Задайте одно движение камеры
Для короткого ролика лучше работает одно движение камеры: наезд, отъезд, облет, плавная панорама или статичная пауза. Комбинация «наезд + облет + дрон + резкий зум» почти всегда провоцирует дрожь и разрывы между кадрами. Укажите не только движение, но и запрет: без тряски, без смены ракурса, без внезапного монтажа. Так нейросеть для видео держит композицию стабильнее.
Было
Камера летит вокруг, приближается, потом резко уходит вверх.
Стало
Камера: медленный наезд на 10%, уровень глаз, без вращения. Сохранить горизонт и положение героя. Без тряски, без смены объектива, без склеек.

- 4.
Проверьте лицо, руки, фон и темп перед рендером
Перед запуском финальной генерации проверьте четыре риска: лицо, руки, фон и темп. В реальном тесте для короткого fashion-кадра Kling 3.0 первый рендер дал шесть пальцев на руке, а повтор с ограничением `preserve finger count, keep both hands anatomically correct` убрал артефакт без смены позы. Для людей явно просите сохранять черты лица, количество пальцев и пропорции тела. Для предметов фиксируйте форму, логотипы лучше не добавлять в кадр мелким текстом, а для фона запрещайте появление новых объектов. Отдельно задайте длительность: 4-6 секунд обычно безопаснее, чем длинный ролик с большим числом событий.
Было
Сделай 12 секунд, пусть персонаж идет, машет рукой, камера меняет ракурс, фон оживает.
Стало
Длительность 5 секунд. Сохранить лицо, руки, одежду и фон. Движение только одно: герой делает полшага вперед, ткань слегка колышется. Без новых людей, без деформации рук, без смены сцены.

