FLUX.1 Pro / FLUX.1.1 Pro Ultra
FLUX.1 — флагманская image-модель от Black Forest Labs (schnell, dev, pro, 1.1 pro Ultra). Двойной энкодер CLIP + T5-XXL интерпретирует д…
ImageFLUX Kontext Pro / Max / Multi
FLUX Kontext — image-to-image модель редактирования от Black Forest Labs (Pro, Max, Multi). Принимает входное изображение плюс инструкцию…
ImageGPT Image 1
GPT Image 1 — image-модель от OpenAI с естественным языковым промптингом и сильным рендерингом текста в кадре. Работает через ChatGPT и A…
ImageGPT Image 1.5
GPT Image 1.5 — image-модель OpenAI с улучшенным фотореализмом, сохранением идентичности при редактировании и multi-image входом. Поддерж…
ImageGPT Image 2
GPT Image 2 — image-модель от OpenAI с SOTA-рендерингом текста и thinking mode. Понимает промпт как бриф для дизайнера, обрабатывает слов…
ImageGrok Imagine (Aurora)
Grok Imagine (Aurora) — image-модель xAI с авторегрессивной MoE Transformer архитектурой, не diffusion. Сильна в фотореалистичных портрет…
VideoHappy Horse 1.0
Happy Horse 1.0 (快乐小马) — video-модель от Alibaba ATH AI Innovation Unit, 15B параметров, unified single-stream Transformer. Генерирует 5–…
VideoHiggsfield Soul 2.0 / Soul Cinema / DoP
Higgsfield — платформа с проприетарными моделями Soul 2.0 (image, до 4K), Soul Cinema (era-aware image) и DoP (image-to-video, 5 секунд,…
ImageImagen 4
Imagen 4 — image-модель Google нового поколения с улучшенной типографикой и ультра-фотореализмом. Работает на естественном языке, оптимиз…
ImageImagen 4 Ultra
Imagen 4 Ultra — premium-версия Imagen 4 от Google с максимальной детализацией и верностью промпту. Раскрывается на длинных детальных опи…
VideoKling 2.6 Pro
Kling 2.6 Pro — видеомодель от Kuaishou, доступная на klingai.com. Генерирует клипы до 10 секунд в 1080p, поддерживает T2V, I2V, Elements…
VideoKling 3.0
Kling 3.0 — флагманская видеомодель Kuaishou на klingai.com. Длительность до 15 секунд, Multi-shot до 6 шотов в одной генерации, нативная…
VideoKling Motion Control
Kling Motion Control — режим Kling от Kuaishou для переноса движений с референсного видео на персонажа из изображения. Длительность 5–10…
VideoKling O1
Kling O1 — рассуждающая видеомодель Kuaishou на klingai.com. Длительность до 10 секунд, разрешение до 1080p, четыре специализированных ре…
VideoLTX 2 (Fast / Pro)
LTX 2 — open-source видеомодель от Lightricks на ltx.io. Существует в двух версиях: Fast (до 20 секунд, 2× быстрее) и Pro (до 10 секунд,…
VideoLuma Ray 2
Luma Ray 2 — крупномасштабная видеомодель Luma в Dream Machine, обученная напрямую на видеоданных. Понимает естественное движение, реалис…
VideoLuma Ray 3 / Ray 3.14 / Ray 3 Reasoning
Luma Ray 3 — линейка моделей Luma: Ray 3.14 (рабочая лошадка, default для 90% задач), Ray 3 Reasoning (мультимодальная «рассуждающая» мод…
ImageLuma Uni-1
Luma Uni-1 — image-модель Luma Labs с уникальной архитектурой: decoder-only autoregressive transformer (НЕ диффузия), генерирует пиксели…
ImageMidJourney V7
Midjourney V7 — флагманская image-модель Midjourney с релиза 3 апреля 2025. V7 фундаментально изменила работу с промптами: теперь модель…
ImageMidJourney V8 (Alpha)
Midjourney V8 Alpha — новая модель, доступная с 17 марта 2026 только на alpha.midjourney.com (Discord не поддерживается). V8 — это не улу…
ImageMidJourney V8.1 (Alpha)
Midjourney V8.1 Alpha — апгрейд V8, доступный только через alpha.midjourney.com (Discord не поддерживается). Главные сдвиги: HD теперь де…
ImageMidJourney Niji (5/6/7)
Midjourney Niji — специализированная модель Midjourney для аниме, манги и восточной иллюстрации. Текущая рекомендуемая версия — Niji 7 (с…
VideoMidJourney Video
Midjourney Video — Image-to-Video модель Midjourney для короткой анимации статичных изображений. Чистый Text-to-Video не поддерживается:…
VideoMiniMax Hailuo 02
MiniMax Hailuo 02 — предшественник Hailuo 2.3, до сих пор актуальный благодаря уникальному режиму FL2V (First-and-Last-Frame-to-Video) и…
VideoMiniMax Hailuo 2.3
MiniMax Hailuo 2.3 — флагман видеомоделей MiniMax: T2V и I2V до 1080P, 25fps, поддержка bracket camera syntax `[Push in]`. Промпт пишется…
VideoMiniMax I2V-01-Live
MiniMax I2V-01-Live — специализированная Image-to-Video модель для анимации 2D-иллюстраций: аниме, манги, цифровых портретов, концепт-арт…
Imagemystic
Mystic 2.5 — проприетарная image-модель Freepik на платформе Pikaso. Текст → изображение до 2K, поддержка референсов типа Style и Charact…
ImageNano Banana 2
Nano Banana 2 — image-модель Google в Gemini API второго поколения, до 2K с базовым thinking mode и поддержкой до 6 референсов. Модель по…
ImageNano Banana Pro
Nano Banana Pro — флагман Google в Gemini 3 Pro Image: 4K, до 14 референсов (6 high fidelity), полный thinking mode и SOTA-рендер текста.…
VideoOmniHuman 1.5
OmniHuman 1.5 — специализированная видеомодель ByteDance для анимации людей по схеме Image + Audio → Video. 1024×1024 при 30fps, до 30 се…
VideoPixVerse V6 (V5.5)
PixVerse V6 — видеомодель PixVerse с нативной генерацией аудио, multi-shot режимом и 20+ cinematic lens controls. Поддерживает T2V и I2V,…
ImageQwen Image (V1 / V2.0)
Qwen Image — image-модель от команды Alibaba Qwen с лидирующим рендерингом текста: коммерческий уровень на английском и китайском, multi-…
ImageRecraft V4 / V4 Pro
Recraft V4 — единственная на рынке AI-модель, генерирующая настоящий редактируемый SVG со структурированными слоями. Точный рендеринг тек…
ImageReve Image 1.0
Reve Image 1.0 — image-модель от Reve AI с 12 миллиардами параметров, нативным 2048×2048 и 4K upscaling. #1 на Artificial Analysis Image…
VideoRunway Act-Two
Runway Act-Two — это performance transfer модель, а не text-to-video. На вход подаётся driving video с актёрским перформансом и character…
VideoRunway Gen-4
Runway Gen-4 — image-to-video модель от Runway с нативным 720p (апскейл до 4K) и длительностью 5 или 10 секунд. Без входного изображения…
VideoRunway Gen-4.5
Runway Gen-4.5 — первая модель Runway с полноценным text-to-video плюс image-to-video в одной архитектуре. Autoregressive-to-Diffusion да…
VideoSeedance 1.0 Lite
Seedance 1.0 Lite — облегчённая версия Seedance от ByteDance. Фиксированные длительности 5 или 10 секунд, разрешение 480p или 720p, тольк…
VideoSeedance 1.0 Pro
Seedance 1.0 Pro — полнофункциональная версия первого поколения video-модели ByteDance на платформе 即梦 (Jimeng). Делает 5 или 10 секунд в…
VideoSeedance 1.5 Pro
Seedance 1.5 Pro — промежуточная версия видео-модели ByteDance между поколениями 1.0 и 2.0. Делает 5 или 10 секунд до 1080p, принимает те…
VideoSeedance 2.0
Seedance 2.0 — флагманская видео-модель ByteDance на платформе 即梦 (Jimeng). Делает 4–15 секунд до 2K, принимает до 9 изображений, 3 видео…
VideoSeedance New
Seedance New — самая свежая итерация видео-модели ByteDance, наследник Seedance 2.0 с экспериментальными улучшениями. Делает 4–15 секунд…
ImageSeedream 4.0
Seedream 4.0 — базовая версия image-модели ByteDance первого поколения семейства. Делает text-to-image до 2K, оптимальная длина промпта 2…
ImageSeedream 4.5
Seedream 4.5 — мейнстрим-версия image-модели ByteDance. Делает text-to-image, image-to-image и multi-image blending до 4K. Оптимальная дл…
ImageSeedream 5 Lite
Seedream 5 Lite — самая свежая версия image-модели ByteDance. Делает text-to-image, image-to-image, multi-image blending, inpainting и ou…
VideoSora 2 / Sora 2 Pro
Sora 2 — video-модель от OpenAI с нативным звуком, поддержкой до двух персонажей через Characters API и клипами 4-20 секунд. Промпт работ…
VideoVeed Fabric 1.0
Veed Fabric 1.0 — специализированная lip-sync модель, а не генератор видео общего назначения. На вход идёт изображение и аудио (или речев…
VideoGoogle Veo 3
Veo 3 — первая модель Google DeepMind с нативной генерацией аудио вместе с видео: диалоги, фоновые звуки, музыка, SFX. Клипы ~8 секунд, р…
VideoGoogle Veo 3.1 (включает Veo 3.1 Fast и Veo 3.1 Fast Relax)
Veo 3.1 — обновлённая видео-модель Google DeepMind с улучшенным следованием промпту, нативным 1080p, вертикальным форматом 9:16 и режимом…
ImageWan (General — 2.5 / 2.6)
Wan — открытая T2I-модель от Alibaba, доступная через fal.ai, Replicate и для локального запуска. Принимает промпты на естественном языке…
ImageZ-Image (Base / Turbo)
Z-Image — компактная 6B image-модель от Alibaba Tongyi-MAI с открытыми весами под Apache 2.0. Главные фичи — билингвальный рендеринг текс…