Upscaler

upscaler — модель для увеличения картинки с восстановлением деталей

Раздел
Инструменты
Обновлено
18.05.26

Upscaler — это нейросеть для увеличения картинки с восстановлением деталей, а не простой интерполяцией. Классическое увеличение в Photoshop в 4 раза превращает резкое фото в размытое; AI-upscaler анализирует структуру и достраивает резкие края. Главные семейства 2026 года: RealESRGAN (общий, быстрый), 4x-UltraSharp (фотореализм), SwinIR (универсальный), SUPIR (тяжёлый, художественный). Применяется для печати, hi-res fix, восстановления старых снимков.

Коротко

Коротко. Upscaler — это AI-увеличение картинки. В отличие от обычной интерполяции (которая размывает), AI-апскейлер восстанавливает резкие края, текстуры и микро-детали. Стандарт ×2 или ×4. Главные семейства: RealESRGAN, 4x-UltraSharp, SwinIR, SUPIR. Используется в hi-res fix, подготовке к печати, восстановлении старых фото.

Что это такое

Фотограф снимает работы AI-генерации в SD 1.5 — выходит 512×512. Клиент просит для печати на A3, нужно минимум 3500×3500. Простое увеличение в Photoshop через Bicubic превращает фото в размытое пятно: интерполяция между пикселями не создаёт деталей, она просто «растягивает» существующие.

Решение — AI-upscaler. Модель училась на парах «маленькая картинка → большая картинка» (обычно через downscale качественных фото). В инференсе она получает мелкий вход и достраивает недостающие детали: чёткие края, текстуру кожи, фактуру ткани.

Главные семейства в 2026 году:

  • RealESRGAN (2021) — самый универсальный, быстрый, ×2 / ×4. Стандарт de facto для большинства задач.
  • 4x-UltraSharp — тренирован на фотореализме, лучше для портретов и снимков.
  • SwinIR / Lanczos++ — для иллюстраций и текста, не «галлюцинирует» детали.
  • SUPIR (2024) — тяжёлый, но даёт лучшее качество. Использует SDXL внутри. Время — секунды на маленьких, минуты на больших.
  • Topaz Gigapixel — коммерческий, не open-source, в Photoshop / desktop-приложении.
  • Latent Upscaler — апскейл в латентном пространстве вместо пиксельного.

Скачивают модели обычно в формате .pth или .safetensors, размер 60–400 МБ. В Automatic1111 кладутся в models/ESRGAN/, в ComfyUImodels/upscale_models/.

Как это работает

Большинство upscaler — это свёрточные нейросети (CNN или GAN), обученные на парах:

  1. Берём большое чистое фото (например, 2048×2048).
  2. Уменьшаем до 512×512 — это вход.
  3. Тренируем модель восстанавливать оригинал из уменьшенной версии.
  4. После миллионов пар модель «знает», какие детали обычно бывают на разных типах фактур: кожа, листва, ткань, кирпич.

В инференсе:

  1. Входная картинка проходит через сеть.
  2. Сеть удваивает (или учетверяет) каждую размерность.
  3. На выходе картинка ×2 или ×4 с восстановленными резкими краями.

В Automatic1111 апскейлер запускается на вкладке Extras или через Hi-Res Fix (тогда он встроен в пайплайн txt2img). В ComfyUI — узел Upscale Image (using Model). В Photoshop — Topaz Gigapixel или Image Enhance (с 2024).

Для сверхбольших картинок (8K+) часто комбинируют:

  1. Upscaler ×4 от RealESRGAN.
  2. Затем второй проход через SUPIR или SDXL img2img с denoise 0.2 для полировки.

Пример на практике

Дизайнер сгенерировал кадр SDXL 1024×1024. Клиент: «для постера A1, минимум 6000×6000».

В ComfyUI:

  1. Upscale Image (using Model) с RealESRGAN_x4plus.pth → 4096×4096.
  2. VAE Encode результата.
  3. KSampler с denoise=0.25, тот же seed, тот же промпт → латент-полировка.
  4. VAE Decode → 4096×4096 финал.
  5. Затем ещё один ×2 через 4x-UltraSharp → 8192×8192.
  6. Обрезка до 6000×6000.

40 секунд на пайплайн на RTX 4070. Качество достаточно для печати без артефактов.

Альтернатива — Topaz Gigapixel AI для desktop-фотографов: одна кнопка, без знаний пайплайна. Платный (~$100), но самый простой путь для тех, кто работает в Photoshop.

С чем часто путают

  • Upscaler и Hi-Res Fix — Hi-Res Fix это техника двухступенчатой генерации SD (сначала маленькая, потом img2img на большой). Upscaler — отдельный шаг для увеличения готовой картинки.
  • Upscaler и Outpainting — outpainting расширяет холст (добавляет области по краям). Upscaler увеличивает все пиксели пропорционально.
  • Upscaler и Refiner — Refiner — это полировка финальных шагов SDXL, разрешение не меняется. Upscaler — увеличение разрешения.
  • Upscaler и VAE — VAE кодирует/декодирует латент. Upscaler работает в пиксельном пространстве (обычно) и увеличивает изображение целиком.

Частые ошибки и заблуждения

  • «Все upscaler одинаковые». Не одинаковые. RealESRGAN универсальный, 4x-UltraSharp для фото, 4x-AnimeSharp для аниме. На разных типах материала разница 20–40% по качеству.
  • «Чем больше коэффициент, тем лучше». До ×4 — обычно да. Выше ×8 — модели плохо тренировались, появляются артефакты. Лучше делать каскадом: ×2 → ×2 → ×2.
  • «Upscaler работает с любым разрешением». Технически да, но память растёт квадратично. На 12 ГБ VRAM ×4 от 4096×4096 уже падает с OOM.
  • «SUPIR — лучший upscaler». На художественных кадрах и портретах — часто да. На документах и графике — может «нарисовать» лишних деталей, не подходит.
  • «Upscaler не нужен, если генерировать сразу в 4K». Часто наоборот. Большинство моделей плохо работают на сверхвысоких разрешениях. Лучше сгенерировать на родном и потом апскейлить.

Связанные термины

  • Hi-Res Fix — двухступенчатая техника с использованием апскейлера.
  • SUPIR — флагманский upscaler 2024 года на базе SDXL.
  • RealESRGAN — наиболее популярный универсальный апскейлер.
  • 4x-UltraSharp — фотореалистичный апскейлер.
  • Face Restoration — отдельный инструмент для восстановления лиц.
  • Aspect Ratio / Resolutionпараметры, которые upscaler меняет.

Частые вопросы

Какой upscaler выбрать? По типу контента: фото → 4x-UltraSharp / RealESRGAN_x4plus. Иллюстрации / аниме → 4x-AnimeSharp / 4x-UniversalUpscaler. Текст / графика → SwinIR / Lanczos. Премиум-финал → SUPIR.

Сколько VRAM нужно? RealESRGAN ×4 для 1024×1024 → 4096×4096: ~6 ГБ. Для 2048×2048 → 8192×8192: ~12 ГБ. SUPIR гораздо больше — 16+ ГБ для тех же задач.

Где скачать upscaler? OpenModelDB — главный каталог. Также GitHub-репозитории моделей (xinntao для RealESRGAN, Phhofm для UltraSharp), CivitAI (раздел Other Resources).

Можно ли использовать upscaler с FLUX? Да, это отдельный шаг после генерации. Работает с любой моделью, потому что апскейлер обрабатывает пиксели, а не латент.

В чём разница между Latent Upscaler и обычным? Latent Upscaler работает в латентном пространстве (быстрее, экономит VAE-pass). Обычный — в пиксельном (точнее, но дольше). На практике большинство использует пиксельный из-за лучшего качества.

Что такое Hi-Res Fix? Двухступенчатая техника в Automatic1111: сгенерировать маленькую картинку → апскейлить → img2img на новом разрешении с тем же промптом. Часто чище, чем чистый upscaler.

Главное

Upscaler — обязательный шаг для большинства коммерческих задач: печать, баннеры, постеры. Главное — выбрать правильную модель под тип материала: RealESRGAN для универсального, 4x-UltraSharp для фото, SUPIR для премиум-финала. Не делайте ×8+ за один шаг — каскад из ×2 + ×2 даёт чище результат. В ComfyUI это узел Upscale Image (using Model), в Automatic1111 — вкладка Extras или Hi-Res Fix.