Upscaler
upscaler — модель для увеличения картинки с восстановлением деталей
Upscaler — это нейросеть для увеличения картинки с восстановлением деталей, а не простой интерполяцией. Классическое увеличение в Photoshop в 4 раза превращает резкое фото в размытое; AI-upscaler анализирует структуру и достраивает резкие края. Главные семейства 2026 года: RealESRGAN (общий, быстрый), 4x-UltraSharp (фотореализм), SwinIR (универсальный), SUPIR (тяжёлый, художественный). Применяется для печати, hi-res fix, восстановления старых снимков.
Коротко
Коротко. Upscaler — это AI-увеличение картинки. В отличие от обычной интерполяции (которая размывает), AI-апскейлер восстанавливает резкие края, текстуры и микро-детали. Стандарт ×2 или ×4. Главные семейства: RealESRGAN, 4x-UltraSharp, SwinIR, SUPIR. Используется в hi-res fix, подготовке к печати, восстановлении старых фото.
Что это такое
Фотограф снимает работы AI-генерации в SD 1.5 — выходит 512×512. Клиент просит для печати на A3, нужно минимум 3500×3500. Простое увеличение в Photoshop через Bicubic превращает фото в размытое пятно: интерполяция между пикселями не создаёт деталей, она просто «растягивает» существующие.
Решение — AI-upscaler. Модель училась на парах «маленькая картинка → большая картинка» (обычно через downscale качественных фото). В инференсе она получает мелкий вход и достраивает недостающие детали: чёткие края, текстуру кожи, фактуру ткани.
Главные семейства в 2026 году:
- RealESRGAN (2021) — самый универсальный, быстрый, ×2 / ×4. Стандарт de facto для большинства задач.
- 4x-UltraSharp — тренирован на фотореализме, лучше для портретов и снимков.
- SwinIR / Lanczos++ — для иллюстраций и текста, не «галлюцинирует» детали.
- SUPIR (2024) — тяжёлый, но даёт лучшее качество. Использует SDXL внутри. Время — секунды на маленьких, минуты на больших.
- Topaz Gigapixel — коммерческий, не open-source, в Photoshop / desktop-приложении.
- Latent Upscaler — апскейл в латентном пространстве вместо пиксельного.
Скачивают модели обычно в формате .pth или .safetensors, размер 60–400 МБ. В Automatic1111 кладутся в models/ESRGAN/, в ComfyUI — models/upscale_models/.
Как это работает
Большинство upscaler — это свёрточные нейросети (CNN или GAN), обученные на парах:
- Берём большое чистое фото (например, 2048×2048).
- Уменьшаем до 512×512 — это вход.
- Тренируем модель восстанавливать оригинал из уменьшенной версии.
- После миллионов пар модель «знает», какие детали обычно бывают на разных типах фактур: кожа, листва, ткань, кирпич.
В инференсе:
- Входная картинка проходит через сеть.
- Сеть удваивает (или учетверяет) каждую размерность.
- На выходе картинка ×2 или ×4 с восстановленными резкими краями.
В Automatic1111 апскейлер запускается на вкладке Extras или через Hi-Res Fix (тогда он встроен в пайплайн txt2img). В ComfyUI — узел Upscale Image (using Model). В Photoshop — Topaz Gigapixel или Image Enhance (с 2024).
Для сверхбольших картинок (8K+) часто комбинируют:
- Upscaler ×4 от RealESRGAN.
- Затем второй проход через SUPIR или SDXL img2img с denoise 0.2 для полировки.
Пример на практике
Дизайнер сгенерировал кадр SDXL 1024×1024. Клиент: «для постера A1, минимум 6000×6000».
В ComfyUI:
- Upscale Image (using Model) с
RealESRGAN_x4plus.pth→ 4096×4096. - VAE Encode результата.
- KSampler с denoise=0.25, тот же seed, тот же промпт → латент-полировка.
- VAE Decode → 4096×4096 финал.
- Затем ещё один ×2 через
4x-UltraSharp→ 8192×8192. - Обрезка до 6000×6000.
40 секунд на пайплайн на RTX 4070. Качество достаточно для печати без артефактов.
Альтернатива — Topaz Gigapixel AI для desktop-фотографов: одна кнопка, без знаний пайплайна. Платный (~$100), но самый простой путь для тех, кто работает в Photoshop.
С чем часто путают
- Upscaler и Hi-Res Fix — Hi-Res Fix это техника двухступенчатой генерации SD (сначала маленькая, потом img2img на большой). Upscaler — отдельный шаг для увеличения готовой картинки.
- Upscaler и Outpainting — outpainting расширяет холст (добавляет области по краям). Upscaler увеличивает все пиксели пропорционально.
- Upscaler и Refiner — Refiner — это полировка финальных шагов SDXL, разрешение не меняется. Upscaler — увеличение разрешения.
- Upscaler и VAE — VAE кодирует/декодирует латент. Upscaler работает в пиксельном пространстве (обычно) и увеличивает изображение целиком.
Частые ошибки и заблуждения
- «Все upscaler одинаковые». Не одинаковые. RealESRGAN универсальный, 4x-UltraSharp для фото, 4x-AnimeSharp для аниме. На разных типах материала разница 20–40% по качеству.
- «Чем больше коэффициент, тем лучше». До ×4 — обычно да. Выше ×8 — модели плохо тренировались, появляются артефакты. Лучше делать каскадом: ×2 → ×2 → ×2.
- «Upscaler работает с любым разрешением». Технически да, но память растёт квадратично. На 12 ГБ VRAM ×4 от 4096×4096 уже падает с OOM.
- «SUPIR — лучший upscaler». На художественных кадрах и портретах — часто да. На документах и графике — может «нарисовать» лишних деталей, не подходит.
- «Upscaler не нужен, если генерировать сразу в 4K». Часто наоборот. Большинство моделей плохо работают на сверхвысоких разрешениях. Лучше сгенерировать на родном и потом апскейлить.
Связанные термины
- Hi-Res Fix — двухступенчатая техника с использованием апскейлера.
- SUPIR — флагманский upscaler 2024 года на базе SDXL.
- RealESRGAN — наиболее популярный универсальный апскейлер.
- 4x-UltraSharp — фотореалистичный апскейлер.
- Face Restoration — отдельный инструмент для восстановления лиц.
- Aspect Ratio / Resolution — параметры, которые upscaler меняет.
Частые вопросы
Какой upscaler выбрать? По типу контента: фото → 4x-UltraSharp / RealESRGAN_x4plus. Иллюстрации / аниме → 4x-AnimeSharp / 4x-UniversalUpscaler. Текст / графика → SwinIR / Lanczos. Премиум-финал → SUPIR.
Сколько VRAM нужно? RealESRGAN ×4 для 1024×1024 → 4096×4096: ~6 ГБ. Для 2048×2048 → 8192×8192: ~12 ГБ. SUPIR гораздо больше — 16+ ГБ для тех же задач.
Где скачать upscaler? OpenModelDB — главный каталог. Также GitHub-репозитории моделей (xinntao для RealESRGAN, Phhofm для UltraSharp), CivitAI (раздел Other Resources).
Можно ли использовать upscaler с FLUX? Да, это отдельный шаг после генерации. Работает с любой моделью, потому что апскейлер обрабатывает пиксели, а не латент.
В чём разница между Latent Upscaler и обычным? Latent Upscaler работает в латентном пространстве (быстрее, экономит VAE-pass). Обычный — в пиксельном (точнее, но дольше). На практике большинство использует пиксельный из-за лучшего качества.
Что такое Hi-Res Fix? Двухступенчатая техника в Automatic1111: сгенерировать маленькую картинку → апскейлить → img2img на новом разрешении с тем же промптом. Часто чище, чем чистый upscaler.
Главное
Upscaler — обязательный шаг для большинства коммерческих задач: печать, баннеры, постеры. Главное — выбрать правильную модель под тип материала: RealESRGAN для универсального, 4x-UltraSharp для фото, SUPIR для премиум-финала. Не делайте ×8+ за один шаг — каскад из ×2 + ×2 даёт чище результат. В ComfyUI это узел Upscale Image (using Model), в Automatic1111 — вкладка Extras или Hi-Res Fix.