Image

Google Imagen: как писать промпты, которые модель понимает

Google · Обновлено:

Google Imagen — семейство image-моделей от Google, доступное через ImageFX, Vertex AI и Freepik. Понимает естественный язык лучше, чем списки тегов через запятую, оптимизировано под английский и поддерживает читаемый текст на изображениях. Негативный промпт не поддерживается — описывай, что нужно, а не то, чего быть не должно.

Что умеет Google Imagen

Imagen — это text-to-image модель: рендерит фотореалистичные кадры, иллюстрации, графический дизайн и кинематографические сцены до 1024×1024 в популярных соотношениях (1:1, 4:3, 3:4, 9:16, 16:9). В отличие от Stable Diffusion, модель построена на естественном языке — связные предложения работают лучше, чем теги через запятую.

Главное прикладное преимущество — рендер текста прямо в изображении: вывески, постеры, заголовки, упаковка. Точный текст указывается в кавычках, дополнительно прописывается шрифт и расположение. Контент-фильтры Google блокируют реалистичные лица публичных персон, NSFW и насилие.

  • Естественный язык вместо тегов через запятую
  • Рендер читаемого текста на изображениях
  • Соотношения 1:1, 4:3, 3:4, 9:16, 16:9
  • Широкий стилевой диапазон: фотореализм, иллюстрация, концепт-арт
  • Негативные промпты не поддерживаются — только позитивные формулировки

Структура промпта и фреймворк SCULPT

Оптимальный порядок: [Тип изображения/стиль] + [Субъект] + [Действие/поза] + [Окружение/сцена] + [Освещение] + [Композиция/ракурс] + [Детали материалов/текстур] + [Настроение/атмосфера].

Для построения промпта удобен фреймворк SCULPT: Subject (кто/что), Context (где), Unique details (текстуры и материалы), Lighting (тип света — golden hour, rim light, chiaroscuro), Perspective (ракурс — close-up, low angle, aerial), Tone/Theme (cinematic, noir, dreamy, editorial). Не обязательно использовать все шесть элементов — но чем конкретнее описание, тем точнее результат. Минимум 10 слов, рекомендованный диапазон — 50–300 слов.

Рендер текста на изображениях

Imagen умеет генерировать читаемый текст внутри изображения — вывески, плакаты, заголовки, обложки. Чтобы попасть в кадр без искажений, нужны три вещи:

Точный текст в кавычках («reads "OPEN"», «sign that says "Coffee Bar"»). Стиль шрифта прописывается отдельно: «bold sans-serif», «handwritten script», «neon lettering», «hand-painted lettering». Расположение указывается явно: «at the top», «on the banner», «above the entrance», «on the sign».

Для коротких надписей результат стабильный. Длинный текст без кавычек модель часто искажает — добавляет лишние буквы или меняет порядок. Запросы на лица публичных персон блокируются content-фильтром.

Типичные ошибки

  1. 1. Список тегов через запятую вместо естественных предложений

    Imagen построен на natural language — связное описание работает значительно лучше, чем «girl, red dress, street, sunset, bokeh, cinematic». Пиши промпт как краткий бриф для фотографа: связные предложения, конкретные детали, осмысленный порядок.

  2. 2. Негативные формулировки в основном промпте

    Imagen не поддерживает negative prompt. Фразы вроде «without people», «no clouds», «not blurry» либо игнорируются, либо наоборот добавляют упомянутые элементы. Описывай только то, что нужно видеть на изображении — позитивные формулировки.

  3. 3. Собственные имена из фикшена для фотореализма

    Запрос «photorealistic image of Valyria» или «realistic photo of Gandalf» модель ассоциирует с книжными иллюстрациями и concept art из обучающих данных. Для фотореалистичного стиля описывай характеристики: «glorious titanic city with Greco-Roman architecture» вместо имени.

  4. 4. Слишком короткий или перегруженный промпт

    Промпт меньше 10 слов оставляет модели слишком много свободы — она «додумывает» сцену по-своему. Промпт больше 500 слов без чёткой иерархии создаёт конфликты между элементами. Оптимально 50–300 слов с главным субъектом в начале.

  5. 5. Конфликтующие стили в одном промпте

    «Photorealistic anime watercolor oil painting» — модель не знает, какой стиль выбрать, и выдаёт неконтролируемый микс. Определись с одним основным стилем (фотореализм, иллюстрация, концепт-арт) и используй вспомогательные стилистические маркеры внутри него.

Примеры до/после

Пример 1

Было

красивая девушка в платье на улице

Стало

Editorial fashion photograph of a young woman with copper-red hair wearing a flowing emerald silk dress, walking through a sunlit Parisian street, golden hour rim light, shallow depth of field, shot on 35mm film, Kodak Portra 400, warm cinematic color grading, layered composition with soft bokeh in background.

Главные изменения: конкретные детали внешности и одежды, явное окружение, профессиональная фото-лексика (плёнка, объектив, глубина резкости), указание ракурса и освещения.

Пример 2

Было

плакат с надписью кафе

Стало

Vintage café poster, large bold serif typography at the top reading "BROOKLYN COFFEE", subtitle in handwritten script reading "since 1982", warm cream background, hand-painted lettering style, subtle paper texture, muted earth tones, editorial layout, centered composition.

Точный текст в кавычках, отдельные указания шрифта для заголовка и подзаголовка, расположение, фон и стиль — собирает почти production-ready макет.

Пример 3

Было

эпический дракон в горах

Стало

Cinematic concept art of a massive ancient dragon with iridescent emerald scales perched on a moss-covered mountain peak, volumetric god rays piercing through morning mist, low angle wide shot, dramatic chiaroscuro lighting, Peter Jackson epic style, rich earthy tones with golden highlights, particle effects of floating ash, high-resolution digital painting.

SCULPT в работе: субъект, контекст, уникальные детали (iridescent scales, moss), освещение (god rays, chiaroscuro), перспектива (low angle wide), тон (Peter Jackson epic style).

Частые вопросы

Поддерживает ли Imagen негативные промпты?
Нет, в отличие от Stable Diffusion и Kling, Google Imagen не поддерживает negative prompt как отдельное поле. Все попытки описать «чего не должно быть» внутри основного промпта либо игнорируются, либо наоборот добавляют упомянутые объекты в кадр. Описывай позитивно: вместо «no clouds» используй «clear blue sky», вместо «not blurry» — «sharp focus».
Какое оптимальное соотношение сторон выбрать?
Imagen поддерживает пять стандартных соотношений: 1:1 для социальных сетей и аватаров, 4:3 и 3:4 для презентаций и карточек товаров, 16:9 для обложек YouTube и баннеров, 9:16 для Stories, Reels и TikTok. Выбирай исходя из конечной площадки, а не «универсального» 1:1 — модель оптимизирует композицию под целевое соотношение.
Можно ли писать промпты на русском?
Можно, но не рекомендуется. Imagen оптимизирован под английский, и качество на русском заметно снижается — модель чаще ошибается с деталями, теряет стилистические нюансы и хуже понимает кинематографическую лексику. Для production-задач переводи промпт на английский, для экспериментов и быстрых черновиков русский допустим.
Как добиться чёткого текста на изображении?
Три обязательных условия: точный текст в кавычках («reads "Coffee"»), явное указание стиля шрифта («bold sans-serif», «handwritten script»), и расположение в кадре («at the top», «on the banner»). Для коротких надписей до 3–5 слов результат стабильный. Длинный текст модель часто искажает — разбивай на несколько коротких блоков с явным расположением каждого.
Почему Imagen отказывается генерировать?
Контент-фильтры Google блокируют четыре основные категории: реалистичные лица публичных персон (политики, актёры, музыканты), NSFW-контент, сцены насилия, материалы с защищённым копирайтом. Фильтр семантический — обходить эвфемизмами не получится. Если получаешь отказ, замени конкретное имя на описание характеристик или переформулируй сцену в editorial/concept-art стиль.
Чем Imagen отличается от Midjourney и DALL-E?
Главные отличия: Imagen построен на естественном языке (Midjourney тоже, но с параметрами вроде --ar, которые в Imagen не работают), сильнее в рендере текста на изображениях, оптимизирован под фотореализм и кинематографические сцены. Параметры синтаксиса Midjourney (`--ar 16:9`, `--stylize`) и DALL-E попадают в текст промпта как мусор — используй естественные описания.
Поддерживается ли Opten для Google Imagen?
Да, расширение Opten автоматически распознаёт Google Imagen внутри ImageFX и других платформ Google AI, оценивает промпты по описанной выше структуре: проверяет естественный язык, наличие субъекта в начале, точный текст в кавычках для типографики, фотографическую лексику. Одним кликом можно получить rewrite в правильной структуре SCULPT.

Похожие модели

Готов писать промпты для Google Imagen в один клик?

  • Автоопределение модели прямо в её интерфейсе
  • Скоринг каждой строки промпта
  • Rewrite по правильной структуре одной кнопкой
ChromeYandex BrowserChrome / Yandex BrowserУстановить расширение

Pro — $2.99/мес или 199 ₽/мес · отмена в любое время