Image

Nano Banana 2: как писать промпты, которые модель понимает

Google · Обновлено:

Nano Banana 2 — image-модель Google в Gemini API второго поколения, до 2K с базовым thinking mode и поддержкой до 6 референсов. Модель понимает естественный язык и полные описательные предложения как бриф художника, а не «tag soup». Английский — основной язык; диалоговое редактирование поддерживается.

Что умеет Nano Banana 2

Модель оптимизирована под коммерчески яркую эстетику Google: тёплая палитра, насыщенные цвета, чистая композиция. Сильна на портретных close-up'ах — заметно меньше uncanny valley, чем у Pro, и более естественная текстура кожи с порами и микро-несовершенствами. Хорошо отрабатывает плёночные стили (Kodak Portra 400, 35mm), ретро-эпохи 1990s/2000s, селфи и social media-контент.

Для простого редактирования есть диалоговый режим — правки в рамках сессии нормальны. Базовый рендеринг текста работает для коротких надписей (1-3 слова); плотный текст и инфографику лучше отдавать Pro или GPT Image 2.

  • До 2K, до 6 референсных изображений за запрос
  • Естественный язык, полные предложения, бриф вместо тегов
  • Базовый thinking mode + базовый Google Search grounding
  • Сильные стороны: портреты, селфи, плёночный реализм, candid
  • 3-5x быстрее и ~25% от стоимости Pro — модель для итераций

Структура промпта

Оптимальный порядок: [Субъект с деталями] + [Сцена/Окружение] + [Освещение/Настроение] + [Стиль] + [Камера (опционально)] + [Формат].

Главное правило — конкретность субъекта. Вместо «девушка на улице» — «молодая женщина с короткими рыжими волосами в джинсовой куртке стоит на перекрёстке токийской улицы вечером, уличные фонари создают тёплые блики на мокром асфальте». Промпт меньше 10 слов модель додумает по-своему, и результат будет генерик.

Контекст назначения (для чего изображение — обложка альбома, аватар, рекламный баннер) помогает модели принимать стилистические решения автоматически. Это особенность Google-семейства — она «думает» о цели, а не только о визуале.

Естественный язык, не tag soup

Tag soup в стиле Midjourney («woman, paris, cafe, golden, 4k, realistic») критически снижает качество. Nano Banana 2 обучена на описательных текстах и ожидает связные предложения. Это та же логика, что и у gpt-image-2 и Pro-версии — пиши как креативный директор, диктующий бриф фотографу.

Параметры вида `--ar 16:9`, `::weight`, `(keyword:1.2)`, BREAK не работают и попадают в текст промпта как мусор. Формат задавай словами («16:9», «portrait», «square»), вес идей — порядком (важное в начало), стили — нормальными прилагательными.

Редактирование и over-edit

Диалоговое редактирование — основной режим для правок. Если изображение готово на 80%, не генерируй заново: «отлично, теперь смени фон на закатный и сделай куртку тёмно-синей». Модель помнит контекст сессии.

Известная слабость — over-edit при загруженных референсах: NB2 склонна «улучшать» рефренс, даже когда просили сохранить как есть. Лекарство — эксплицитный preserve-блок: «keep identity 100% — do not stylize, no enhancement, do not airbrush skin». Для портретов с реальной кожей это критично — без блока модель сгладит поры и сделает «глянцевое» лицо.

Типичные ошибки

  1. 1. Tag soup вместо предложений

    «woman, paris, cafe, golden, 4k, realistic» — устаревший синтаксис Midjourney/SD. Nano Banana 2 обучена на описательных текстах и при tag soup даёт обобщённый, неточный результат. Пиши связные предложения как бриф для фотографа — это удваивает качество на тех же словах.

  2. 2. Слишком короткий промпт (<10 слов)

    «Девушка в кафе» — модель додумает всё остальное по статистике обучающей выборки. Получишь обобщённую блондинку в обобщённом Старбаксе с обобщённым латте. Минимальный рабочий промпт — субъект с деталями + сцена + стиль. Это ~25-40 слов как стартовая точка.

  3. 3. Описание содержимого при I2I редактировании

    При диалоговой правке не пересказывай картинку. Модель её видит. Промпт «на фото девушка в кафе, поменяй фон» бесполезен — пиши только «change only the background to...». Описание содержимого тратит токены и иногда конфликтует с тем, что модель уже считала с изображения.

  4. 4. Отсутствие preserve-блока при правках

    NB2 склонна к over-edit на референсах — «улучшает» сверх просьбы. «Поменяй фон» без «preserve: face, identity, skin texture» в большинстве случаев меняет ещё и кожу, заглаживая поры до глянца. Каждая правка должна заканчиваться явным preserve-списком — это известная слабость модели.

  5. 5. Использование NB2 для плотного текста и сложных сцен

    Постеры с длинным текстом, инфографика, упаковка, 4+ персонажа в кадре — это домен Pro или GPT Image 2. NB2 справляется с короткими надписями (1-3 слова) и одиночными портретами. На сложных задачах модель путает идентичности и ломает плотный текст — это не баг промпта, а архитектурный потолок версии.

Примеры до/после

Пример 1

Было

красивая девушка в кафе

Стало

A young woman in her late twenties with short auburn hair and freckles, wearing a worn olive-green linen shirt, sitting at a small marble café table in Lisbon, sipping espresso. Soft afternoon light spills through the window, warm muted tones, shallow depth of field. Shot on 35mm film, Kodak Portra 400, natural grain, visible pores, no airbrush look. Editorial documentary style.

Конкретный субъект, конкретная локация, конкретное освещение и плёночный стек. Указание «no airbrush» — анти-glamour стоп-команда, без неё NB2 сгладит кожу.

Пример 2

Было

сделай фон темнее

Стало

Keep the subject and pose exactly as is. Change only the background: from the bright café window to a moody, dim interior with warm tungsten lamp light in the far corner. Preserve: face, identity, skin texture, hair, clothing, camera angle, framing. No re-styling of the person, no airbrushing, no over-saturation.

Диалоговая правка с явным preserve-блоком. Без него NB2 «улучшит» заодно и лицо, заглаживая текстуру кожи — это её хрестоматийный over-edit.

Пример 3

Было

стильный аватар для соцсетей

Стало

Square 1:1 social media avatar for an indie illustrator. Mid-shot of a young man with curly black hair and round tortoise-shell glasses, wearing a mustard knit sweater, faint smile, natural relaxed posture. Soft north-window light, neutral grey background, warm color grade. Style: editorial portrait with subtle 2000s digital camera feel, natural skin texture with visible pores, no glamour retouch.

Назначение («social media avatar for an indie illustrator») активирует у NB2 нужный режим. Указан формат, эпоха камеры и явный отказ от ретуши.

Частые вопросы

Чем Nano Banana 2 отличается от Nano Banana Pro?
NB2 — это 2K, до 6 референсов, базовый thinking mode и базовый рендер текста. Pro — это 4K, до 14 референсов (6 high fidelity), полный thinking с промежуточными изображениями и SOTA-рендер текста. Но NB2 не «урезанная Pro»: на портретных close-up'ах, селфи, макро-коже и candid-фото NB2 объективно даёт более естественный результат — меньше uncanny valley и AI-глянца.
Почему NB2 заглаживает кожу даже когда я не прошу?
Это её главная слабость — over-edit при загруженных референсах. Модель «помогает» сверх просьбы: разглаживает поры, убирает несовершенства, добавляет глянец. Лекарство — эксплицитный preserve-блок: «keep identity 100% — do not stylize, no enhancement, do not airbrush skin, preserve natural pores and texture». Это стек, который надо повторять на каждой итерации редактирования.
Можно ли писать промпты на русском?
Технически да, NB2 поддерживает мультиязычность, но Google оптимизировала модель под английский — это её родной язык обучения. На сложных промптах с русским будут менее предсказуемые результаты. Рекомендация: основная масса промпта на английском, текст внутри изображения можно просить на любом языке (кириллица, CJK поддерживаются, но в Pro лучше).
Когда выбрать NB2, а когда Pro?
NB2 — для одиночных портретов, селфи, макро-кожи, candid-документалки, экстремальных пропорций (4:1, 8:1), массовой итерации (10 вариантов перед финалом). Pro — для 4+ персонажей в кадре, hero-кампаний, плотного текста на постерах/упаковке, инфографики, ray-traced освещения, сториборда на 9-10 кадров и структурного контроля по скетчам. Не «выше = лучше», это разные инструменты.
Поддерживается ли диалоговое редактирование?
Да, и это рекомендуемый способ для мелких правок. Не пиши промпт заново ради смены освещения — попроси: «отлично, теперь смени свет на закатный и сделай куртку тёмно-синей, остальное оставь как есть». Модель помнит контекст сессии. Главное — всегда добавлять preserve-блок при правках, иначе NB2 «улучшит» лицо.
Как добиться плёночного реализма без AI-глянца?
Стек: «35mm film, Kodak Portra 400, natural grain, warm muted tones, shallow depth of field, golden hour» + анти-glamour лексика «no airbrush look, visible pores, weathered skin texture, no glamour retouch». Описывай реальные несовершенства — это контрвес коммерческому глянцу, в который NB2 уходит по дефолту. Указание эпохи камеры (1990s, 2000s) тоже помогает.
Поддерживается ли Opten для Nano Banana 2?
Да, расширение Opten автоматически распознаёт Nano Banana 2 в Google AI Studio и Gemini и оценивает промпты по структуре выше: проверяет конкретность субъекта, естественный язык вместо tag soup, наличие preserve-блока при редактировании, анти-glamour лексику для портретов. Одним кликом получаешь rewrite, который не уйдёт в коммерческий глянец и сохранит текстуру кожи.

Похожие модели

Готов писать промпты для Nano Banana 2 в один клик?

  • Автоопределение модели прямо в её интерфейсе
  • Скоринг каждой строки промпта
  • Rewrite по правильной структуре одной кнопкой
ChromeYandex BrowserChrome / Yandex BrowserУстановить расширение

Pro — $2.99/мес или 199 ₽/мес · отмена в любое время