Image

Nano Banana Pro: как писать промпты, которые модель понимает

Google · Обновлено:

Nano Banana Pro — флагман Google в Gemini 3 Pro Image: 4K, до 14 референсов (6 high fidelity), полный thinking mode и SOTA-рендер текста. Думающая модель: понимает намерение, физику и композицию, читает промпт как бриф креативного директора. Английский — основной язык; JSON-структуры работают отлично.

Что умеет Nano Banana Pro

Pro — это 10 ключевых возможностей сразу: SOTA-рендер текста с инфографикой и многоязычной типографикой, Identity Locking через 14 референсов (6 high fidelity), grounding через Google Search, мощное редактирование без масок, перевод 2D→3D, нативная генерация до 4K, thinking с промежуточными изображениями, сториборды на 9-10 кадров, структурный контроль по скетчам и вайрфреймам, актуальные данные через поиск.

Это отдельный класс модели для hero brand assets, постеров, упаковки, сложных сцен с 4+ персонажами и production-ready инфографики. Сюда идут задачи, где нужен максимальный контроль и высокое разрешение, а не быстрая итерация.

  • До 4K, до 14 референсов (6 high fidelity)
  • SOTA-рендер текста: постеры, упаковка, инфографика, многоязычная типографика
  • Полный thinking mode с промежуточными «мыслительными» изображениями
  • Google Search grounding для актуальных данных
  • Структурный контроль: скетчи, вайрфреймы, сетки как входные изображения

Структура промпта

Оптимальный порядок: [Субъект с деталями] + [Сцена/Окружение] + [Освещение] + [Камера/Объектив] + [Текстуры/Материалы] + [Стиль/Настроение] + [Контекст назначения] + [Формат].

Золотое правило — Creative Director, а не Tag Soup. Pro — думающая модель, она понимает намерение. Промпт должен звучать как бриф для художника. Конкретные параметры камеры значительно влияют на результат: «Shot on Sony A7III with 85mm f/1.4 lens, classic three-point lighting setup, natural skin texture with visible pores, catchlights in eyes». Для сложных сцен можно использовать JSON-структуру — Pro отлично её парсит.

Brightness bias и как с ним бороться

Pro имеет встроенный bias в сторону яркого, насыщенного, «полированного» изображения. Модель «чинит» overcast, добавляет saturation, тянет в тёплый glow. Симптомы: просили пасмурную атмосферу — получили утренний свет; просили desaturated noir — получили насыщенный editorial; просили реалистичный candid — получили polished commercial.

Контр-приёмы (стакать 2-3 одновременно): эксплицитно «overcast, muted desaturated palette, cool color temperature, no auto-brightening»; анти-glamour «no polished glamour, no commercial polish, raw documentary aesthetic»; цветокор «dim ambient lighting, low contrast, faded vintage color grade, neutral exposure»; жанровый якорь «the look of news photojournalism» или «the look of a real police evidence photo».

Многореференсный режим (10+ изображений)

Когда загружено 8+ референсов, обычные правила перестают работать — промпт превращается в перегруженный список, и модель теряется. Работают другие правила.

Ссылайся на референс, не переописывай его: вместо «куртка цвета хаки с кожаным воротником и четырьмя карманами» — «куртка с @ref2». Назначь каждой картинке роль: «камера в правой руке (@ref3), сумка через плечо (@ref4), компас на поясе (@ref5)». Каждый референс = место в сцене. Выбрасывай рефы без чёткого размещения — лучше 4 точно размещённых, чем 14 размытых. На 12+ референсов ожидай отказа части деталей — заранее выбери 2-3 самых важных.

Типичные ошибки

  1. 1. Tag soup на думающей модели

    «woman, paris, cafe, golden, 4k, realistic» теряет 60% потенциала Pro. Модель обучена на полных предложениях, её thinking-механизм считывает связные описания, а не теги. Пиши как креативный директор, диктующий бриф фотографу — длинные описательные предложения с грамматикой удваивают качество на тех же словах.

  2. 2. Игнорирование brightness bias

    Pro по умолчанию тянет в яркое, насыщенное, polished. Для noir, документалки, candid, horror — это критическая проблема. Без стека анти-glamour лексики («overcast, muted, no polished glamour, raw documentary») модель сделает «красиво», даже если просили «правдиво». Стакай 2-3 контр-приёма одновременно.

  3. 3. Переописание каждого референса на 10+ загруженных

    На 8+ референсах подробные описания перестают работать — промпт превращается в перегруженный список. Правильно: «куртка с @ref2», «камера в правой руке (@ref3)». Назначь каждой картинке роль в сцене. Без чёткого размещения референс будет проигнорирован или испортит композицию.

  4. 4. Identity Locking забыт при сериях

    Без явной команды «keep facial features 100% identical to Image 1» модель меняет черты лица от кадра к кадру — даже на одной модели. Для сториборда на 9-10 кадров Identity Locking повторяется в каждом промпте, и обязательна стабилизация одежды («clothing and appearance remain stable across all frames»).

  5. 5. Перегенерация вместо диалогового редактирования

    Pro помнит контекст сессии и поддерживает правки в диалоге. Если изображение готово на 80%, не пиши промпт заново ради смены освещения или цвета. Скажи: «отлично, теперь смени свет на закатный, остальное оставь». Это сохраняет идентичность персонажа и быстрее, чем новый seed.

Примеры до/после

Пример 1

Было

вирусный тамбнейл для ютуба

Стало

Viral YouTube thumbnail, 16:9 landscape. Left side: the man from Image 1 (keep facial features 100% identical to reference), surprised expression, mouth open, pointing dramatically at the right side of the frame. Right side: a sleek black gaming laptop on a glossy desk. Center-bottom: bold yellow outlined text «MIND BLOWN», sans-serif heavy weight, slight 3D depth. Color palette: high-contrast yellow, magenta, deep black background with subtle radial glow behind the laptop. Style: high click-through-rate YouTube thumbnail aesthetic.

Identity Locking, явное назначение (viral thumbnail), точный текст в кавычках с указанием шрифта, цветовая палитра, формат. Pro собирает почти production-ready тамбнейл за один проход.

Пример 2

Было

пасмурный документальный кадр

Стало

A weathered fisherman repairing a torn net on a wooden pier, late autumn morning. Overcast, muted desaturated palette, cool color temperature, dim ambient lighting, low contrast, faded vintage color grade, neutral exposure. No polished glamour, no commercial polish, raw documentary aesthetic. The look of news photojournalism — visible skin texture, weathered hands, worn jacket, no airbrushing. Shot on 35mm with mild film grain, slight desaturation.

Анти-brightness-bias стек: цветокор + анти-glamour + жанровый якорь. Без него Pro «починит» пасмурную атмосферу и сделает теплое утро вместо документального серого.

Пример 3

Было

инфографика финансовый отчёт

Стало

Pitch-deck slide titled "Annual Revenue Growth 2026". Visualize a 4-quarter bar chart with values: "Q1 $2.4M", "Q2 $3.1M", "Q3 $4.2M", "Q4 $5.8M". Use Inter bold sans-serif for labels, brand color #1A73E8 for bars, subtle gridlines, clean white background. Subtitle below chart in smaller weight: "45% YoY growth". Bottom-right: brand logo placeholder labeled "COMPANY". Style: modern editorial infographic, crisp 4K rendering, no decorative noise.

Pro — единственная в семействе с production-ready рендером плотного текста и цифр. Указан шрифт, hex-цвет, layout — модель собирает почти готовый слайд.

Частые вопросы

Когда Pro, а когда Nano Banana 2?
Pro — для 4+ персонажей в кадре, hero brand assets, плотного текста на постерах/упаковке, инфографики, ray-traced освещения, сторибордов на 9-10 кадров, 10+ референсов, структурного контроля по скетчам. NB2 — для одиночных портретных close-up'ов (меньше uncanny valley), макро-кожи, селфи, candid-документалки, экстремальных пропорций, массовой итерации (10 вариантов перед финалом). Не «выше = лучше», это разные инструменты.
Что такое thinking mode и как он влияет на результат?
Pro по умолчанию «думает» — генерирует промежуточные «мыслительные» изображения для уточнения композиции перед финальным рендером. Это позволяет решать визуальные уравнения, делать «до/после» рассуждения, использовать Google Search и проверять собственный результат. Время генерации дольше, но качество первого прохода значительно выше — особенно на сложных сценах с инфографикой и многими элементами.
Работают ли JSON-промпты?
Да, Pro отлично понимает JSON-структуры — это один из рекомендуемых способов для сложных сцен с множеством деталей. Структура: subject (description, expression, clothing), photography (camera_style, lighting, lens), background (setting, elements, atmosphere). Эта техника даёт максимальный контроль и удобна для шаблонизации в production-пайплайнах.
Как добиться плёночного реализма без glossy AI-look?
Стакай контр-приёмы против brightness bias: «overcast, muted desaturated palette, cool color temperature, dim ambient lighting, low contrast, faded vintage color grade, neutral exposure» + «no polished glamour, no commercial polish, raw documentary aesthetic» + жанровый якорь «the look of news photojournalism». Описывай реальные несовершенства: «visible pores, weathered skin, fabric wear, subtle film grain». 2-3 контр-приёма обязательны.
Сколько референсов имеет смысл загружать?
Pro держит до 14 (6 high fidelity), но на 12+ ожидай отказа части деталей — модель не уместит всё. Оптимально 4-8 точно размещённых референсов с явной ролью каждого («куртка с @ref2», «фон с @ref7»). 14 размытых рефов хуже 4 точных. Заранее выбери 2-3 самых важных и убедись, что они описаны однозначно — остальные станут bonus, не базой.
Поддерживается ли многоязычный текст в изображении?
Да, Pro — SOTA в семействе по рендерингу текста: латиница, кириллица, CJK (китайский, японский, корейский), арабский, хинди, бенгали. Точный текст всегда в кавычках с указанием шрифта, кегля, цвета и расположения. Для длинного текста добавляй «EXACT» или «verbatim»: «label text (EXACT): "Fresh and clean"». Для постеров и упаковки в семействе только Pro даёт production-ready результат.
Поддерживается ли Opten для Nano Banana Pro?
Да, расширение Opten автоматически распознаёт Nano Banana Pro в Google AI Studio и Gemini 3 Pro и оценивает промпты по структуре выше: проверяет brief-style вместо tag soup, наличие Identity Locking при референсах, анти-brightness-bias стек для документалки и noir, точный текст в кавычках, роли при многореференсных промптах. Одним кликом получаешь rewrite, который не уйдёт в коммерческий глянец.

Похожие модели

Готов писать промпты для Nano Banana Pro в один клик?

  • Автоопределение модели прямо в её интерфейсе
  • Скоринг каждой строки промпта
  • Rewrite по правильной структуре одной кнопкой
ChromeYandex BrowserChrome / Yandex BrowserУстановить расширение

Pro — $2.99/мес или 199 ₽/мес · отмена в любое время