MiniMax Hailuo 02: как писать промпты, которые модель понимает
MiniMax · Обновлено:
MiniMax Hailuo 02 — предшественник Hailuo 2.3, до сих пор актуальный благодаря уникальному режиму FL2V (First-and-Last-Frame-to-Video) и сильной физике на экстремальных движениях вроде гимнастики и паркура. Промпт пишется как режиссёрские заметки, поддерживается bracket camera syntax `[Push in]`. Английский предпочтителен; оптимальная длина 40-60 слов.
Что умеет Hailuo 02
Hailuo 02 — старая видеомодель MiniMax, но не «устаревшая». У неё есть два уникальных козыря, которых нет в более новой 2.3.
Первый — режим FL2V (First-and-Last-Frame-to-Video): модель принимает ДВА кадра (начальный и конечный) и генерирует плавный переход между ними. Это незаменимо для морфинга, сезонных трансформаций (лето → зима), смены состояний объекта.
Второй — экстремальная физика: гимнастика, паркур, акробатика, сложные физические движения. На таких сценах 02 даёт более реалистичную динамику, чем 2.3. Плюс поддержка 512P для быстрого прототипирования. Для всего остального — стандартных T2V и I2V — лучше брать 2.3.
- FL2V — уникальный режим первого и последнего кадра
- Экстремальная физика: гимнастика, паркур, акробатика
- Разрешения: 512P, 768P (default), 1080P
- Длительность: 6с или 10с (на 512P/768P); 6с на 1080P
- Bracket camera syntax `[Push in]`, `[Tracking shot]`, до 3 одновременных команд
Структура промпта
Стиль совпадает с Hailuo 2.3 — режиссёрские заметки на естественном языке, не теги. Оптимальная длина 40-60 слов, максимум 2000 символов.
Формула: [Камера + движение] + [Субъект + описание] + [Действие в present tense] + [Стиль и атмосфера] + [Эмоциональные маркеры].
Пример: «[Push in] A young woman in a flowing red dress spins gracefully on a moonlit terrace, her hair catching the breeze. Cinematic, dreamlike atmosphere, soft warm rim light, serene emotional tone.» Глаголы в настоящем времени («spins», «catches»), бренд-семантика «[Push in]» — bracket syntax работает.
FL2V — уникальный режим
Главная фича Hailuo 02. Принимает два кадра: первый = начальное состояние сцены, последний = конечное состояние. Модель генерирует плавный переход. Это другой стиль промптинга — не описание сцены, а описание ПРОЦЕССА перехода.
Хороший FL2V промпт: «The flower gradually blooms, petals slowly unfurling outward, camera holding steady on a close-up». Плохой — описание содержимого первого или последнего кадра (они уже определены изображениями). Указывай характер перехода: плавный, резкий, постепенный. Указывай поведение камеры во время перехода. Если в настройках выбран FL2V, но второго кадра нет — это критическая ошибка, модель не сможет сгенерировать.
Bracket Camera Syntax
Hailuo 02 поддерживает тот же синтаксис, что и 2.3 — точный кинематографический контроль через квадратные скобки. Базовые команды: `[Truck left]`, `[Truck right]` (горизонтальное перемещение); `[Pan left]`, `[Pan right]` (панорама); `[Push in]`, `[Pull out]` (наезд/отъезд); `[Pedestal up]`, `[Pedestal down]` (подъём камеры); `[Tilt up]`, `[Tilt down]` (наклон); `[Zoom in]`, `[Zoom out]` (зум); `[Shake]` (тряска); `[Tracking shot]` (следящий кадр); `[Static shot]` (статика).
Комбинирование: `[Pan left,Pedestal up]` — максимум 3 одновременных команды. Последовательно: «...[Push in], then...[Pull out]». Это фича модели, а не ошибка форматирования — bracket syntax активирует прямой контроль камеры.
Типичные ошибки
1. Tag-based промпты вместо предложений
«cyberpunk, rain, neon, 4k» — Hailuo 02 обучена на нарративных описаниях. Tag soup даёт обобщённый результат с непредсказуемой динамикой. Пиши режиссёрские заметки: «[Push in] Neon-lit Tokyo street, heavy rain falling on wet asphalt, lone figure walking through reflections.»
2. Quality boosters в стиле «8k masterpiece»
«ultra-detailed, 8k, masterpiece, best quality» вызывают чрезмерную насыщенность и контраст в финальном видео. Качество определяется конкретностью описания сцены, движения и камеры, а не магическими токенами. На Hailuo 02 quality spam особенно ломает физику движений.
3. Описание содержимого первого/последнего кадра в FL2V
Если включён режим FL2V, первый и последний кадры заданы изображениями — их не нужно описывать. Промпт должен описывать ПРОЦЕСС ПЕРЕХОДА между ними: характер движения, поведение камеры, темп. Описание содержимого кадров тратит токены и сбивает модель.
4. FL2V без второго референса
FL2V требует ДВА изображения — первый и последний кадр. Если в настройках выбран FL2V, но загружен только один или ни одного — это критическая ошибка, модель не сможет сгенерировать переход. Перед использованием FL2V убедись, что оба референса загружены.
5. Использование 02 когда нужен 2.3
Hailuo 02 — старая модель. Если задача стандартная (T2V или I2V без FL2V, без экстремальной физики) — лучше брать Hailuo 2.3: она новее, точнее, дешевле в Fast-версии. 02 имеет смысл только для FL2V, спортивной физики или быстрых тестов на 512P. Для большинства задач — 2.3 правильнее.
Примеры до/после
Пример 1
Было
красивый закат превращается в ночь
Стало
[FL2V mode, frame 1: golden sunset over the ocean; frame 2: deep blue night with stars]. The sky gradually transitions from warm golden tones to deep indigo, sun slowly sinking below the horizon, first stars beginning to twinkle. Camera holds steady on the wide horizon. Smooth, gradual atmospheric shift, peaceful contemplative mood.
FL2V промпт описывает ПРОЦЕСС перехода, не кадры (они заданы изображениями). Указан характер перехода (gradual, smooth), поведение камеры (holds steady), эмоциональный тон.
Пример 2
Было
гимнастка делает сальто
Стало
[Tracking shot] A young female gymnast in a white leotard performs a backflip on a sunlit gymnastics floor, body fully extended mid-air, sharp focus on her arched form. Realistic physics, smooth body mechanics, dynamic energy. Sports broadcast aesthetic, tense and energetic emotional tone.
Экстремальная физика — сильная сторона Hailuo 02. Bracket `[Tracking shot]` ведёт камеру за движением. Глагол в present tense, явные физические маркеры (body fully extended, arched form).
Пример 3
Было
кошка прыгает на стол
Стало
[Static shot] A ginger cat crouches on the kitchen floor, tail flicking, then leaps gracefully onto the wooden countertop, landing softly. Natural daylight from the window, calm domestic atmosphere, slight cinematic tension during the leap.
Статичная камера для предсказуемого кадра, конкретные глаголы (crouches, flicking, leaps, landing), описание физики приземления (softly). Не tag soup «кошка, прыжок, кухня, 4K».