AI-модели

Каталог AI-моделей для генерации изображений и видео, в которых работает Opten. Каждая страница — разбор структуры промпта, типичных ошибок и примеров для конкретной модели: Midjourney, Kling 3.0, Veo 3.1, Seedance, Flux, Imagen и других.

FLUX.1 Pro / FLUX.1.1 Pro Ultra

FLUX.1 — флагманская image-модель от Black Forest Labs (schnell, dev, pro, 1.1 pro Ultra). Двойной энкодер CLIP + T5-XXL интерпретирует д…

FLUX Kontext Pro / Max / Multi

FLUX Kontext — image-to-image модель редактирования от Black Forest Labs (Pro, Max, Multi). Принимает входное изображение плюс инструкцию…

GPT Image 1

GPT Image 1 — image-модель от OpenAI с естественным языковым промптингом и сильным рендерингом текста в кадре. Работает через ChatGPT и A…

GPT Image 1.5

GPT Image 1.5 — image-модель OpenAI с улучшенным фотореализмом, сохранением идентичности при редактировании и multi-image входом. Поддерж…

GPT Image 2

GPT Image 2 — image-модель от OpenAI с SOTA-рендерингом текста и thinking mode. Понимает промпт как бриф для дизайнера, обрабатывает слов…

Grok Imagine (Aurora)

Grok Imagine (Aurora) — image-модель xAI с авторегрессивной MoE Transformer архитектурой, не diffusion. Сильна в фотореалистичных портрет…

Happy Horse 1.0

Happy Horse 1.0 (快乐小马) — video-модель от Alibaba ATH AI Innovation Unit, 15B параметров, unified single-stream Transformer. Генерирует 5–…

Higgsfield Soul 2.0 / Soul Cinema / DoP

Higgsfield — платформа с проприетарными моделями Soul 2.0 (image, до 4K), Soul Cinema (era-aware image) и DoP (image-to-video, 5 секунд,…

Imagen 4

Imagen 4 — image-модель Google нового поколения с улучшенной типографикой и ультра-фотореализмом. Работает на естественном языке, оптимиз…

Imagen 4 Ultra

Imagen 4 Ultra — premium-версия Imagen 4 от Google с максимальной детализацией и верностью промпту. Раскрывается на длинных детальных опи…

Kling 2.6 Pro

Kling 2.6 Pro — видеомодель от Kuaishou, доступная на klingai.com. Генерирует клипы до 10 секунд в 1080p, поддерживает T2V, I2V, Elements…

Kling 3.0

Kling 3.0 — флагманская видеомодель Kuaishou на klingai.com. Длительность до 15 секунд, Multi-shot до 6 шотов в одной генерации, нативная…

Kling Motion Control

Kling Motion Control — режим Kling от Kuaishou для переноса движений с референсного видео на персонажа из изображения. Длительность 5–10…

Kling O1

Kling O1 — рассуждающая видеомодель Kuaishou на klingai.com. Длительность до 10 секунд, разрешение до 1080p, четыре специализированных ре…

LTX 2 (Fast / Pro)

LTX 2 — open-source видеомодель от Lightricks на ltx.io. Существует в двух версиях: Fast (до 20 секунд, 2× быстрее) и Pro (до 10 секунд,…

Luma Ray 2

Luma Ray 2 — крупномасштабная видеомодель Luma в Dream Machine, обученная напрямую на видеоданных. Понимает естественное движение, реалис…

Luma Ray 3 / Ray 3.14 / Ray 3 Reasoning

Luma Ray 3 — линейка моделей Luma: Ray 3.14 (рабочая лошадка, default для 90% задач), Ray 3 Reasoning (мультимодальная «рассуждающая» мод…

Luma Uni-1

Luma Uni-1 — image-модель Luma Labs с уникальной архитектурой: decoder-only autoregressive transformer (НЕ диффузия), генерирует пиксели…

MidJourney V7

Midjourney V7 — флагманская image-модель Midjourney с релиза 3 апреля 2025. V7 фундаментально изменила работу с промптами: теперь модель…

MidJourney V8 (Alpha)

Midjourney V8 Alpha — новая модель, доступная с 17 марта 2026 только на alpha.midjourney.com (Discord не поддерживается). V8 — это не улу…

MidJourney V8.1 (Alpha)

Midjourney V8.1 Alpha — апгрейд V8, доступный только через alpha.midjourney.com (Discord не поддерживается). Главные сдвиги: HD теперь де…

MidJourney Niji (5/6/7)

Midjourney Niji — специализированная модель Midjourney для аниме, манги и восточной иллюстрации. Текущая рекомендуемая версия — Niji 7 (с…

MidJourney Video

Midjourney Video — Image-to-Video модель Midjourney для короткой анимации статичных изображений. Чистый Text-to-Video не поддерживается:…

MiniMax Hailuo 02

MiniMax Hailuo 02 — предшественник Hailuo 2.3, до сих пор актуальный благодаря уникальному режиму FL2V (First-and-Last-Frame-to-Video) и…

MiniMax Hailuo 2.3

MiniMax Hailuo 2.3 — флагман видеомоделей MiniMax: T2V и I2V до 1080P, 25fps, поддержка bracket camera syntax `[Push in]`. Промпт пишется…

MiniMax I2V-01-Live

MiniMax I2V-01-Live — специализированная Image-to-Video модель для анимации 2D-иллюстраций: аниме, манги, цифровых портретов, концепт-арт…

mystic

Mystic 2.5 — проприетарная image-модель Freepik на платформе Pikaso. Текст → изображение до 2K, поддержка референсов типа Style и Charact…

Nano Banana 2

Nano Banana 2 — image-модель Google в Gemini API второго поколения, до 2K с базовым thinking mode и поддержкой до 6 референсов. Модель по…

Nano Banana Pro

Nano Banana Pro — флагман Google в Gemini 3 Pro Image: 4K, до 14 референсов (6 high fidelity), полный thinking mode и SOTA-рендер текста.…

OmniHuman 1.5

OmniHuman 1.5 — специализированная видеомодель ByteDance для анимации людей по схеме Image + Audio → Video. 1024×1024 при 30fps, до 30 се…

PixVerse V6 (V5.5)

PixVerse V6 — видеомодель PixVerse с нативной генерацией аудио, multi-shot режимом и 20+ cinematic lens controls. Поддерживает T2V и I2V,…

Qwen Image (V1 / V2.0)

Qwen Image — image-модель от команды Alibaba Qwen с лидирующим рендерингом текста: коммерческий уровень на английском и китайском, multi-…

Recraft V4 / V4 Pro

Recraft V4 — единственная на рынке AI-модель, генерирующая настоящий редактируемый SVG со структурированными слоями. Точный рендеринг тек…

Reve Image 1.0

Reve Image 1.0 — image-модель от Reve AI с 12 миллиардами параметров, нативным 2048×2048 и 4K upscaling. #1 на Artificial Analysis Image…

Runway Act-Two

Runway Act-Two — это performance transfer модель, а не text-to-video. На вход подаётся driving video с актёрским перформансом и character…

Runway Gen-4

Runway Gen-4 — image-to-video модель от Runway с нативным 720p (апскейл до 4K) и длительностью 5 или 10 секунд. Без входного изображения…

Runway Gen-4.5

Runway Gen-4.5 — первая модель Runway с полноценным text-to-video плюс image-to-video в одной архитектуре. Autoregressive-to-Diffusion да…

Seedance 1.0 Lite

Seedance 1.0 Lite — облегчённая версия Seedance от ByteDance. Фиксированные длительности 5 или 10 секунд, разрешение 480p или 720p, тольк…

Seedance 1.0 Pro

Seedance 1.0 Pro — полнофункциональная версия первого поколения video-модели ByteDance на платформе 即梦 (Jimeng). Делает 5 или 10 секунд в…

Seedance 1.5 Pro

Seedance 1.5 Pro — промежуточная версия видео-модели ByteDance между поколениями 1.0 и 2.0. Делает 5 или 10 секунд до 1080p, принимает те…

Seedance 2.0

Seedance 2.0 — флагманская видео-модель ByteDance на платформе 即梦 (Jimeng). Делает 4–15 секунд до 2K, принимает до 9 изображений, 3 видео…

Seedance New

Seedance New — самая свежая итерация видео-модели ByteDance, наследник Seedance 2.0 с экспериментальными улучшениями. Делает 4–15 секунд…

Seedream 4.0

Seedream 4.0 — базовая версия image-модели ByteDance первого поколения семейства. Делает text-to-image до 2K, оптимальная длина промпта 2…

Seedream 4.5

Seedream 4.5 — мейнстрим-версия image-модели ByteDance. Делает text-to-image, image-to-image и multi-image blending до 4K. Оптимальная дл…

Seedream 5 Lite

Seedream 5 Lite — самая свежая версия image-модели ByteDance. Делает text-to-image, image-to-image, multi-image blending, inpainting и ou…

Sora 2 / Sora 2 Pro

Sora 2 — video-модель от OpenAI с нативным звуком, поддержкой до двух персонажей через Characters API и клипами 4-20 секунд. Промпт работ…

Veed Fabric 1.0

Veed Fabric 1.0 — специализированная lip-sync модель, а не генератор видео общего назначения. На вход идёт изображение и аудио (или речев…

Google Veo 3

Veo 3 — первая модель Google DeepMind с нативной генерацией аудио вместе с видео: диалоги, фоновые звуки, музыка, SFX. Клипы ~8 секунд, р…

Google Veo 3.1 (включает Veo 3.1 Fast и Veo 3.1 Fast Relax)

Veo 3.1 — обновлённая видео-модель Google DeepMind с улучшенным следованием промпту, нативным 1080p, вертикальным форматом 9:16 и режимом…

Wan (General — 2.5 / 2.6)

Wan — открытая T2I-модель от Alibaba, доступная через fal.ai, Replicate и для локального запуска. Принимает промпты на естественном языке…

Z-Image (Base / Turbo)

Z-Image — компактная 6B image-модель от Alibaba Tongyi-MAI с открытыми весами под Apache 2.0. Главные фичи — билингвальный рендеринг текс…