Чем Nano Banana отличается от Midjourney и Stable Diffusion?

Главное архитектурное отличие — Nano Banana «думает». Это thinking-модель: она не сопоставляет ключевые слова, а понимает намерение, физику, композицию и контекст назначения. Отсюда — натуральный язык вместо тегов, диалоговое редактирование вместо перегенерации, Google Search grounding для актуальных данных и Identity Locking для консистентности. Промпты других моделей сюда не портируются.

Какие версии входят в семейство Nano Banana?

Базовая Nano Banana (общая, до 1K), Nano Banana 2 (новая, до 2K, до 6 референсов, базовый thinking) и Nano Banana Pro (флагман, до 4K, до 14 референсов, полный thinking, SOTA-рендер текста). Pro — для hero-кампаний и сложных сцен с инфографикой; NB2 — для портретов и итераций; базовая — fallback для совместимости.

Можно ли писать промпты на русском?

Технически да, но Google оптимизировала модели под английский — это родной язык обучения. На сложных промптах с русским будут менее предсказуемые результаты. Рекомендация: основная масса промпта на английском; текст внутри изображения можно просить на любом языке. Кириллица в кадре поддерживается, но в Pro работает лучше всего.

Что такое диалоговое редактирование и когда его использовать?

Это режим, в котором ты ведёшь беседу с моделью внутри одной сессии: первая реплика — генерация, последующие — правки. Модель помнит контекст и применяет правку к одному параметру, не перерисовывая остальное. Используй для любой мелкой правки — смены освещения, цвета одежды, фона, выражения лица. Это быстрее и сохраняет идентичность персонажа.

Поддерживается ли рендеринг текста на изображении?

Да, все версии поддерживают, но качество варьируется. Базовая Nano Banana и NB2 справляются с короткими надписями (1-3 слова). Nano Banana Pro — SOTA-уровень: читаемый стилизованный текст, плотная инфографика, диаграммы, многоязычная типографика (кириллица, CJK, арабский). Для постеров и упаковки — только Pro, базовые версии исказят буквы на длинных надписях.

Как сохранить лицо персонажа через несколько изображений?

Используй Identity Locking: «Keep the person's facial features exactly the same as Image 1. 100% identical facial features, bone structure, skin tone». Pro поддерживает до 14 референсов (6 high fidelity), NB2 — до 6. Для серий — повторяй команду в каждом промпте, иначе модель «улучшит» лицо и сделает облик собирательным. Это известная склонность семейства.

Поддерживается ли Opten для Nano Banana?

Да, расширение Opten автоматически распознаёт все версии Nano Banana (базовая, 2, Pro) в Google AI Studio и Gemini и оценивает промпты по структуре выше: проверяет конкретность субъекта, естественный язык вместо tag soup, Identity Locking при референсах, описание текстур, контекст назначения. Одним кликом получаешь rewrite в правильной структуре под конкретную версию семейства.

Image

Nano Banana: как писать промпты, которые модель понимает

Name: Nano Banana (общий fallback для всех версий)
Brand: Google

Google · Обновлено: 19 мая 2026 г.

Nano Banana — общее имя семейства image-моделей Google в Gemini API. Модель понимает естественный язык и полные описательные предложения, поддерживает диалоговое редактирование, Google Search grounding и референсные изображения. Английский — основной язык; tag soup критически снижает качество. Пиши как креативный директор, а не как набор тегов.

Что умеет семейство Nano Banana

Главное отличие от Midjourney и Stable Diffusion — Nano Banana «думает». Модель не просто сопоставляет ключевые слова, а понимает намерение, физику и композицию. Поддерживает рендеринг текста, инфографику, реставрацию, колоризацию, перевод 2D-планов в 3D-визуализации и структурный контроль по скетчам и вайрфреймам.

Есть Google Search grounding — модель может использовать актуальные данные из поиска для визуализации трендов, реальных людей и событий. Знакомая Google-эстетика: тёплая палитра, насыщенные цвета, чистая композиция. Базовые версии — до 1K, Pro — до 4K.

Естественный язык, полные предложения, бриф вместо тегов
Диалоговое редактирование — правки в рамках сессии
Identity Locking через референсные изображения
Рендеринг текста, инфографика, реставрация, колоризация
Google Search grounding для актуальных данных

Структура промпта

Оптимальный порядок: [Субъект] + [Сцена/Окружение] + [Освещение/Настроение] + [Стиль/Камера] + [Детали материалов/текстур] + [Контекст назначения].

Конкретизируй субъект: вместо «женщина» — «элегантная пожилая женщина в винтажном костюме Chanel, седые волосы, спокойное выражение лица, прямая осанка». Указывай контекст — для чего изображение (обложка журнала, кулинарная книга, рекламный баннер). Это позволяет модели принимать стилистические решения автоматически: для кулинарной книги она сама выберет малую глубину резкости и тёплое естественное освещение.

Редактируй, а не перегенерируй

Главное золотое правило Google — диалоговое редактирование. Если изображение готово на 80%, не пиши промпт заново. Скажи: «отлично, но смени освещение на закатное и сделай текст неоново-синим». Модель помнит контекст сессии и применит правку именно к одному параметру.

Это принципиально иначе, чем в Midjourney или SDXL, где каждый seed — это новое изображение. Для NB-моделей перегенерация ради мелкой правки — антипаттерн. Особенно для портретов с консистентностью персонажа: попроси «измени эмоцию на удивлённую», а не «нарисуй того же человека удивлённым».

Identity Locking для серий

При работе с референсами явно указывай сохранение идентичности: «Keep the person's facial features exactly the same as Image 1. 100% identical facial features, bone structure, skin tone». Без этой команды модель часто «улучшает» лицо — меняет черты, разглаживает кожу, делает облик собирательным.

Для групповых сцен указывай идентичность КАЖДОГО персонажа отдельно, и фиксируй что одежда/внешность стабильны через сцены. Для вирусных тамбнейлов формула работает за один проход: «персонаж с Изображения 1 + жёлтая стрелка + текст в обводке + жирная графика».

Типичные ошибки

1. Tag soup вместо предложений
«dog, park, 4k, realistic» — это синтаксис старых diffusion-моделей. Nano Banana обучена на описательных текстах и при tag soup даёт обобщённый, неточный результат. Используй полные предложения с правильной грамматикой и описательными прилагательными — это удваивает качество на тех же словах.
2. Перегенерация вместо редактирования
Если изображение готово на 80% и нужна мелкая правка, не пиши промпт заново. Скажи в диалоге «отлично, теперь смени освещение на закатное». Перегенерация ради смены одного параметра — антипаттерн для NB. Это особенно критично при работе с консистентностью персонажа: новый seed = новое лицо.
3. Отсутствие Identity Locking при референсах
Без явной команды «keep facial features exactly the same as Image 1» модель часто «улучшает» лицо: меняет черты, разглаживает кожу, делает облик собирательным. Для серий и многократного использования одного персонажа Identity Locking — обязательный блок, а не опция.
4. Игнорирование текстур и материалов
Без описания текстур изображение получится «гладким» и AI-узнаваемым. Указывай конкретные поверхности: «visible pores», «matte ceramic», «brushed steel», «rough concrete». Для портрета текстура важнее объектива; для продукта — важнее освещения. Это особенность Google-семейства, она оптимизирована под детализированные поверхности.
5. Копирование синтаксиса Midjourney/DALL-E
Параметры `::weight`, `--ar 16:9`, `(keyword:1.2)`, BREAK не работают и попадают в текст промпта как мусор. Формат задавай словами («16:9», «portrait», «square»), вес идей — порядком (важное в начало), стили — нормальными прилагательными. Семейство Nano Banana — отдельная вселенная синтаксиса.

Примеры до/после

Пример 1

Было

крутая машина в городе

Стало

Cinematic wide shot of a futuristic sports car speeding down a rain-soaked Tokyo street at night. Neon signs reflect on the wet asphalt and the car's polished black metallic body. Long-exposure motion streaks suggest speed. Shot on 35mm with anamorphic lens, shallow depth of field, moody cyberpunk color grade — deep blues and magentas. Style: editorial automotive photography for a luxury brand campaign.

Tag soup «крутая машина, неон, город, ночь, 8k» заменён на бриф для фотографа: композиция, освещение, объектив, цветокор и назначение (luxury brand campaign).

Пример 2

Было

удали туристов с фото

Стало

In this photo, remove all background tourists. Fill the empty space with logical environmental textures: matching cobblestone pavement, the same shopfronts continuing seamlessly, consistent shadow direction from the sun. Preserve: the main subject (the woman in red coat in the foreground), the building architecture, the camera angle, the time-of-day lighting. No watermark, no extra figures.

Семантическое редактирование без маски — фишка Nano Banana. Преserve-блок и явное «fill with logical textures» дают чистый результат без артефактов inpainting.

Пример 3

Было

обложка кулинарной книги с сэндвичем

Стало

Premium cover image for a Brazilian gourmet cookbook. Hero shot of a freshly grilled chicken sandwich with melted cheese, crisp lettuce, and a brioche bun, sliced in half and slightly tilted to show the layers. Soft natural window light from the left, shallow depth of field, warm rustic wooden surface, faint herb garnish in the background blur. Editorial food photography style, professional plating, appetizing color grade.

Контекст назначения («premium cookbook cover») активирует у модели нужный режим — она сама выберет глубину резкости, plating и теплоту света. Это особенность Google-семейства.

Nano Banana: как писать промпты, которые модель понимает

Что умеет семейство Nano Banana

Структура промпта

Редактируй, а не перегенерируй

Identity Locking для серий

Типичные ошибки

1. Tag soup вместо предложений

2. Перегенерация вместо редактирования

3. Отсутствие Identity Locking при референсах

4. Игнорирование текстур и материалов

5. Копирование синтаксиса Midjourney/DALL-E

Примеры до/после

Частые вопросы

Похожие модели

Z-Image (Base / Turbo)

Wan (General — 2.5 / 2.6)

Seedream 5 Lite

Готов писать промпты для Nano Banana (общий fallback для всех версий) в один клик?