Nano Banana 2: как писать промпты, которые модель понимает
Google · Обновлено:
Nano Banana 2 — image-модель Google в Gemini API второго поколения, до 2K с базовым thinking mode и поддержкой до 6 референсов. Модель понимает естественный язык и полные описательные предложения как бриф художника, а не «tag soup». Английский — основной язык; диалоговое редактирование поддерживается.
Что умеет Nano Banana 2
Модель оптимизирована под коммерчески яркую эстетику Google: тёплая палитра, насыщенные цвета, чистая композиция. Сильна на портретных close-up'ах — заметно меньше uncanny valley, чем у Pro, и более естественная текстура кожи с порами и микро-несовершенствами. Хорошо отрабатывает плёночные стили (Kodak Portra 400, 35mm), ретро-эпохи 1990s/2000s, селфи и social media-контент.
Для простого редактирования есть диалоговый режим — правки в рамках сессии нормальны. Базовый рендеринг текста работает для коротких надписей (1-3 слова); плотный текст и инфографику лучше отдавать Pro или GPT Image 2.
- До 2K, до 6 референсных изображений за запрос
- Естественный язык, полные предложения, бриф вместо тегов
- Базовый thinking mode + базовый Google Search grounding
- Сильные стороны: портреты, селфи, плёночный реализм, candid
- 3-5x быстрее и ~25% от стоимости Pro — модель для итераций
Структура промпта
Оптимальный порядок: [Субъект с деталями] + [Сцена/Окружение] + [Освещение/Настроение] + [Стиль] + [Камера (опционально)] + [Формат].
Главное правило — конкретность субъекта. Вместо «девушка на улице» — «молодая женщина с короткими рыжими волосами в джинсовой куртке стоит на перекрёстке токийской улицы вечером, уличные фонари создают тёплые блики на мокром асфальте». Промпт меньше 10 слов модель додумает по-своему, и результат будет генерик.
Контекст назначения (для чего изображение — обложка альбома, аватар, рекламный баннер) помогает модели принимать стилистические решения автоматически. Это особенность Google-семейства — она «думает» о цели, а не только о визуале.
Естественный язык, не tag soup
Tag soup в стиле Midjourney («woman, paris, cafe, golden, 4k, realistic») критически снижает качество. Nano Banana 2 обучена на описательных текстах и ожидает связные предложения. Это та же логика, что и у gpt-image-2 и Pro-версии — пиши как креативный директор, диктующий бриф фотографу.
Параметры вида `--ar 16:9`, `::weight`, `(keyword:1.2)`, BREAK не работают и попадают в текст промпта как мусор. Формат задавай словами («16:9», «portrait», «square»), вес идей — порядком (важное в начало), стили — нормальными прилагательными.
Редактирование и over-edit
Диалоговое редактирование — основной режим для правок. Если изображение готово на 80%, не генерируй заново: «отлично, теперь смени фон на закатный и сделай куртку тёмно-синей». Модель помнит контекст сессии.
Известная слабость — over-edit при загруженных референсах: NB2 склонна «улучшать» рефренс, даже когда просили сохранить как есть. Лекарство — эксплицитный preserve-блок: «keep identity 100% — do not stylize, no enhancement, do not airbrush skin». Для портретов с реальной кожей это критично — без блока модель сгладит поры и сделает «глянцевое» лицо.
Типичные ошибки
1. Tag soup вместо предложений
«woman, paris, cafe, golden, 4k, realistic» — устаревший синтаксис Midjourney/SD. Nano Banana 2 обучена на описательных текстах и при tag soup даёт обобщённый, неточный результат. Пиши связные предложения как бриф для фотографа — это удваивает качество на тех же словах.
2. Слишком короткий промпт (<10 слов)
«Девушка в кафе» — модель додумает всё остальное по статистике обучающей выборки. Получишь обобщённую блондинку в обобщённом Старбаксе с обобщённым латте. Минимальный рабочий промпт — субъект с деталями + сцена + стиль. Это ~25-40 слов как стартовая точка.
3. Описание содержимого при I2I редактировании
При диалоговой правке не пересказывай картинку. Модель её видит. Промпт «на фото девушка в кафе, поменяй фон» бесполезен — пиши только «change only the background to...». Описание содержимого тратит токены и иногда конфликтует с тем, что модель уже считала с изображения.
4. Отсутствие preserve-блока при правках
NB2 склонна к over-edit на референсах — «улучшает» сверх просьбы. «Поменяй фон» без «preserve: face, identity, skin texture» в большинстве случаев меняет ещё и кожу, заглаживая поры до глянца. Каждая правка должна заканчиваться явным preserve-списком — это известная слабость модели.
5. Использование NB2 для плотного текста и сложных сцен
Постеры с длинным текстом, инфографика, упаковка, 4+ персонажа в кадре — это домен Pro или GPT Image 2. NB2 справляется с короткими надписями (1-3 слова) и одиночными портретами. На сложных задачах модель путает идентичности и ломает плотный текст — это не баг промпта, а архитектурный потолок версии.
Примеры до/после
Пример 1
Было
красивая девушка в кафе
Стало
A young woman in her late twenties with short auburn hair and freckles, wearing a worn olive-green linen shirt, sitting at a small marble café table in Lisbon, sipping espresso. Soft afternoon light spills through the window, warm muted tones, shallow depth of field. Shot on 35mm film, Kodak Portra 400, natural grain, visible pores, no airbrush look. Editorial documentary style.
Конкретный субъект, конкретная локация, конкретное освещение и плёночный стек. Указание «no airbrush» — анти-glamour стоп-команда, без неё NB2 сгладит кожу.
Пример 2
Было
сделай фон темнее
Стало
Keep the subject and pose exactly as is. Change only the background: from the bright café window to a moody, dim interior with warm tungsten lamp light in the far corner. Preserve: face, identity, skin texture, hair, clothing, camera angle, framing. No re-styling of the person, no airbrushing, no over-saturation.
Диалоговая правка с явным preserve-блоком. Без него NB2 «улучшит» заодно и лицо, заглаживая текстуру кожи — это её хрестоматийный over-edit.
Пример 3
Было
стильный аватар для соцсетей
Стало
Square 1:1 social media avatar for an indie illustrator. Mid-shot of a young man with curly black hair and round tortoise-shell glasses, wearing a mustard knit sweater, faint smile, natural relaxed posture. Soft north-window light, neutral grey background, warm color grade. Style: editorial portrait with subtle 2000s digital camera feel, natural skin texture with visible pores, no glamour retouch.
Назначение («social media avatar for an indie illustrator») активирует у NB2 нужный режим. Указан формат, эпоха камеры и явный отказ от ретуши.