Image

FLUX Kontext: как писать промпты, которые модель понимает

Replicate · Обновлено:

FLUX Kontext — image-to-image модель редактирования от Black Forest Labs (Pro, Max, Multi). Принимает входное изображение плюс инструкцию по изменению. Главное отличие от обычных text-to-image моделей — Kontext видит исходник и не нужно переописывать всю сцену; промпт описывает только что изменить.

Что умеет FLUX Kontext

Kontext — это инструмент для surgical editing: замена объектов, изменение одежды и фона, перенос стиля, редактирование текста, добавление и удаление элементов. Модель сохраняет всё, что не упомянуто в промпте, что делает её идеальной для итеративной работы.

Варианты: [pro] — высокое качество, [max] — максимальная точность плюс лучший рендеринг текста, [dev] — опенсорс. Kontext Multi позволяет комбинировать 2+ входных изображения в одной генерации — например, перенос лица из одного снимка в сцену из другого.

  • Image-to-image редактирование с сохранением неизменённых областей
  • Варианты: Pro, Max, Multi (multi-image), dev
  • Топ-класс по рендерингу текста (особенно [max])
  • Поддержка итеративных правок с сохранением идентичности
  • Multi-image композитинг до 2+ источников

Принципиальное отличие от text-to-image

Kontext видит исходное изображение. Это меняет логику промпта:

НЕ НУЖНО описывать всю сцену целиком. НУЖНО описать только что ИЗМЕНИТЬ. Модель сохранит всё, что не упомянуто.

Плохо: «A woman with red hair wearing a blue dress standing in a park with autumn trees» (это промпт для text-to-image).

Хорошо: «Change her hair color to red» (конкретное изменение).

Короткий промпт «Change the car to red» — это нормально для Kontext, не недостаток. Длина оправдана только для сложных трансформаций.

Структура промпта и уровни детализации

Формула: [Что изменить] + [Как изменить] + [Что сохранить (опционально)].

Уровень 1 (Quick Edit): «Change the car to red» — для простых правок.

Уровень 2 (Controlled Edit): «Change the car to bright red while keeping everything else identical, maintain the same lighting and background» — с указанием что сохранить.

Уровень 3 (Complex Transformation): «Change the background to a beach while keeping the person in the exact same position, maintain identical subject placement, camera angle, framing, and perspective. Only replace the environment around them» — для серьёзных изменений.

Контроль глаголов и точные указания

Глагол определяет масштаб изменения:

«change» — точечная замена. «transform» — глобальное преобразование, может изменить идентичность. «convert» — стилевая конверсия (style transfer). «add» — дополнение без изменения существующего. «replace» — замена конкретного элемента.

Для сохранения лица используй «change», не «transform»: «Transform the person into a Viking» может полностью сменить идентичность. «Change the clothing to Viking armor while keeping the same facial features» — сохранит лицо.

Избегай местоимений. Вместо «she» или «the person» используй описательные фразы: «the woman with short black hair», «the car on the left».

Типичные ошибки

  1. 1. Полное описание сцены вместо инструкции редактирования

    «A woman with red hair in a blue dress standing in a park» — это промпт для text-to-image, не для Kontext. Модель видит исходное изображение; описывать то, что уже есть, не нужно. Описывай только изменения: «Change her hair to red» или «Change the dress to blue».

  2. 2. Размытые инструкции «make it better»

    «Make it better», «Improve the image», «Make it more interesting» — модель не знает что конкретно менять. Указывай чёткое действие: «Change X to Y», «Add Z», «Remove W», «Convert to style S». Конкретика обязательна.

  3. 3. Глагол «transform» для точечных правок

    «Transform the person into a Viking» может полностью сменить идентичность — лицо, телосложение, всё. Для сохранения лица используй «change»: «Change the clothing to Viking armor while keeping the same facial features». Глагол определяет масштаб.

  4. 4. Слишком много изменений за один промпт

    «Change the background, add glasses, change hair color, add a hat, and make it cartoon style» — перегрузка. Kontext работает чище через цепочку из 2-3 простых правок: сначала фон, потом аксессуары, потом стиль. Каждый шаг сохраняет идентичность лучше.

  5. 5. Местоимения вместо описательных фраз

    «Change her dress» в изображении с двумя женщинами — неоднозначно, модель не знает кого редактировать. Используй описание: «the woman on the left», «the woman with dark hair», «the person in the red jacket». Для текста — «the sign above the door».

Примеры до/после

Пример 1

Было

make the image more interesting and cool with better colors

Стало

Change the sky from overcast grey to a vibrant sunset with orange and pink clouds. Keep the building, people, and street unchanged. Maintain the same camera angle, framing, and shadow direction on the ground.

«Make it better» — модель не знает что менять. Конкретное указание ЧТО → ЧТО плюс preserve-блок дают предсказуемый результат.

Пример 2

Было

A beautiful woman with red hair in a blue dress on a beach

Стало

Change the woman's dress from black to navy blue. Change the background from the original setting to a tropical beach at sunset. Keep her exact facial features, pose, body position, and hair unchanged.

Первый промпт — полное описание сцены с нуля, как для text-to-image. Kontext видит исходник; нужны конкретные правки с явным preserve-списком для лица и позы.

Пример 3

Было

change the sign

Стало

Replace the text on the wooden shop sign to read "LIBRARY" in elegant gold serif lettering. Maintain the original sign shape, brick wall background, lighting, and shadows. Match the existing font weight and color tone as closely as possible.

Кавычки фиксируют точный новый текст. Указание шрифта, фиксация фона и тени делают замену чистой и читаемой.

Частые вопросы

В чём разница между Kontext Pro, Max и Multi?
[Pro] — высокое качество для большинства задач редактирования. [Max] — максимальная точность плюс лучший рендеринг текста в кадре; используй когда меняешь надписи или редактируешь типографику. [Multi] — позволяет передать 2+ входных изображения в одну генерацию: например, перенести лицо из одного снимка в сцену из другого. [dev] — опенсорс-вариант с меньшим качеством, но для исследований и некоммерческого использования.
Нужно ли описывать сохранение каждого элемента?
Не всегда. Для простых правок Kontext по умолчанию сохраняет всё неупомянутое. Но для смены фона, окружения или сложных трансформаций явный preserve-блок резко повышает стабильность: «while keeping the same facial features», «maintain the original composition», «keep the lighting and camera angle». Особенно критично при итеративных правках — иначе модель «дрейфует».
Как редактировать текст без потери шрифта?
Используй кавычки для точного нового текста: «Replace 'OPEN' with 'CLOSED'». Добавь «maintain the same font style and color» и старайся сохранить примерно равную длину нового текста — это удерживает layout. Для сложных шрифтов или редкой типографики ставь Kontext Max, у него лучший рендеринг текста среди вариантов модели.
Можно ли использовать Kontext для text-to-image без входного изображения?
Технически да, но это не основной режим модели. Без входного изображения Kontext работает как обычный text-to-image, но качество ниже, чем у FLUX.1 [pro] и [1.1 pro] Ultra, специализирующихся на T2I. Для генерации с нуля используй FLUX.1, для редактирования — Kontext.
Как делать сложные трансформации без потери идентичности?
Разбивай на цепочку из 2-3 простых правок. Не пытайся «change background + add glasses + change hair + make it cartoon» одним промптом — Kontext путается. Лучше: (1) поменять фон, (2) добавить аксессуары, (3) применить стиль. Каждый шаг берёт результат предыдущего как вход — это сохраняет лицо и позу через всю цепочку.
Поддерживает ли Kontext SD-синтаксис?
Нет. Веса вида `(word:1.5)`, `word++`, embeddings, LoRA-ссылки не работают и попадают в промпт как литеральный мусор. Регулируй приоритеты порядком слов (важное — в начало инструкции) и явными формулировками «with emphasis on», «focus on». Это семейство моделей построено на T5-XXL, не на SD-стеке.
Поддерживается ли Opten для FLUX Kontext?
Да, расширение Opten автоматически распознаёт FLUX Kontext и оценивает промпты по структуре редактирования, описанной выше: проверяет наличие конкретного действия, явного preserve-блока для сложных правок, правильного глагола (change vs transform), использования кавычек для текста и описательных фраз вместо местоимений. Одним кликом — rewrite в правильной структуре.

Похожие модели

Готов писать промпты для FLUX Kontext Pro / Max / Multi в один клик?

  • Автоопределение модели прямо в её интерфейсе
  • Скоринг каждой строки промпта
  • Rewrite по правильной структуре одной кнопкой
ChromeYandex BrowserChrome / Yandex BrowserУстановить расширение

Pro — $2.99/мес или 199 ₽/мес · отмена в любое время