Гайды

51

13 марта 2026

Апскейлинг изображений нейросетями на GPU

Как увеличить разрешение изображений с помощью ИИ: ESRGAN, Real-ESRGAN, Topaz, ComfyUI — требования к GPU и практические примеры

ИИ-апскейлинг позволяет увеличить разрешение изображения в 2–4× с сохранением деталей, которых не было в оригинале. Нейросеть «дорисовывает» текстуры, грани и мелкие элементы — результат значительно лучше, чем классический bicubic или Lanczos.

В этом гайде разберём основные инструменты, требования к GPU и практические рабочие процессы.

Методы ИИ-апскейлинга

1. ESRGAN / Real-ESRGAN

Самый популярный и простой метод. Real-ESRGAN — улучшенная версия, обученная на реальных деградациях (JPEG-артефакты, шум, размытие).

Характеристика Значение
Увеличение 2× или 4×
VRAM 1–4 ГБ
Скорость Быстро (1–5 сек на изображение)
Качество Хорошее для фото, среднее для аниме
Контроль Минимальный (модель + масштаб)

Лучше всего для: пакетного апскейлинга фотографий, видео, обложек.

2. Stable Diffusion Upscale (SD Upscaler)

Использует диффузионную модель для «перерисовки» изображения в высоком разрешении. Добавляет детали, которых не было — может как улучшить, так и «придумать» лишнее.

Характеристика Значение
Увеличение 2–4×
VRAM 6–12 ГБ
Скорость Медленно (30–120 сек)
Качество Отличное (с правильными настройками)
Контроль Высокий (prompt, denoise, sampler)

Лучше всего для: AI-арта, иллюстраций, когда нужно максимальное качество.

3. Tiled Upscale (ComfyUI / A1111)

Комбинация: сначала ESRGAN для увеличения, затем Stable Diffusion обрабатывает изображение тайлами (фрагментами), добавляя детали.

Характеристика Значение
Увеличение 2–8×
VRAM 8–16 ГБ (тайлами, не всё изображение сразу)
Скорость Средне (2–10 мин для 4× на большом изображении)
Качество Лучшее (ESRGAN + SD детализация)
Контроль Высокий

Лучше всего для: максимального качества на больших разрешениях (4K, 8K).

4. Topaz Gigapixel AI

Коммерческое решение с GUI. Простое в использовании, но закрытое и платное.

Характеристика Значение
Увеличение До 6×
VRAM 4–8 ГБ
Скорость Средне
Качество Очень хорошее
Цена ~$100 (разовая)

Лучше всего для: пользователей без технического опыта, фотографов.

Сравнение качества

Метод Фото Аниме/Арт Текст на изображении Текстуры
Bicubic (без ИИ) Мыльно Мыльно Мыльно Мыльно
Real-ESRGAN Хорошо Хорошо Средне Хорошо
SD Upscaler Отлично Отлично Может исказить Отлично
Tiled (ESRGAN+SD) Отлично Отлично Средне Отлично
Topaz Очень хорошо Хорошо Хорошо Очень хорошо

Важно: SD Upscaler может «галлюцинировать» детали — добавлять элементы, которых не было. Для документов и текста используйте ESRGAN или Topaz.

Требования к GPU

Задача Мин. VRAM Рекомендуемый GPU
Real-ESRGAN (одно изображение) 2 ГБ Любой GPU
Real-ESRGAN (пакет / видео) 4 ГБ RTX 3060
SD Upscaler (SDXL) 8 ГБ RTX 4060
Tiled Upscale (SDXL) 8 ГБ RTX 4060
Tiled Upscale (высокое качество) 12–16 ГБ RTX 4070 / RTX 4080
Пакетная обработка / видео 4K 16–24 ГБ RTX 3090 / RTX 4090

Практика: Real-ESRGAN

Установка

pip install realesrgan

# Или клонируем репозиторий для больше контроля
git clone https://github.com/xinntao/Real-ESRGAN.git
cd Real-ESRGAN
pip install -r requirements.txt
python setup.py develop

Апскейлинг одного изображения

python inference_realesrgan.py \
    -i input.jpg \
    -o output/ \
    -n RealESRGAN_x4plus \
    --outscale 4 \
    --face_enhance  # Улучшение лиц (GFPGAN)

Модели Real-ESRGAN

Модель Для чего Масштаб
RealESRGAN_x4plus Общее назначение (фото)
RealESRGAN_x4plus_anime_6B Аниме / рисунки
RealESRGAN_x2plus Фото, 2× (быстрее)
realesr-general-x4v3 Общее назначение v3

Пакетная обработка

# Все изображения из папки
python inference_realesrgan.py \
    -i ./input_folder/ \
    -o ./output_folder/ \
    -n RealESRGAN_x4plus \
    --outscale 4

Python API

from realesrgan import RealESRGANer
from basicsr.archs.rrdbnet_arch import RRDBNet
import cv2

# Инициализация
model = RRDBNet(num_in_ch=3, num_out_ch=3, num_feat=64,
                num_block=23, num_grow_ch=32, scale=4)
upsampler = RealESRGANer(
    scale=4,
    model_path='weights/RealESRGAN_x4plus.pth',
    model=model,
    tile=512,       # Тайлинг для экономии VRAM
    tile_pad=10,
    pre_pad=0,
    half=True,      # FP16 — быстрее и меньше VRAM
)

# Апскейлинг
img = cv2.imread('input.jpg', cv2.IMREAD_UNCHANGED)
output, _ = upsampler.enhance(img, outscale=4)
cv2.imwrite('output.png', output)

Практика: SD Upscale в ComfyUI

ComfyUI предоставляет нодовый подход к апскейлингу.

Простой пайплайн: ESRGAN + SD Refiner

  1. Load Image → загружаем исходное изображение
  2. Upscale Image (using Model) → ESRGAN 4×
  3. VAE Encode → кодируем в латентное пространство
  4. KSampler → SD обрабатывает с низким denoise (0.3–0.5)
  5. VAE Decode → декодируем обратно
  6. Save Image → сохраняем результат

Ключевые настройки

Параметр Значение Эффект
Denoise 0.2–0.3 Минимальные изменения, сохраняет оригинал
Denoise 0.4–0.5 Больше деталей, но может изменить содержание
Denoise 0.6+ Сильные изменения — почти перерисовка
Tile size 512–768 Размер тайла (больше = больше VRAM)
Steps 15–25 Количество шагов сэмплинга

Ultimate SD Upscale (кастомная нода)

Для апскейлинга больших изображений с ограниченным VRAM:

Install: ComfyUI Manager  Install Custom Nodes  UltimateSDUpscale

Эта нода автоматически разбивает изображение на тайлы, обрабатывает каждый через SD и сшивает обратно. Результат — апскейлинг до 8K+ даже на 8 ГБ VRAM.

Практика: апскейлинг видео

Real-ESRGAN для видео

python inference_realesrgan_video.py \
    -i input_video.mp4 \
    -o output/ \
    -n realesr-animevideov3 \
    --outscale 2 \
    --num_process_per_gpu 2

FFmpeg + Real-ESRGAN pipeline

# 1. Извлекаем кадры
ffmpeg -i input.mp4 -qscale:v 1 -qmin 1 frames/%06d.png

# 2. Апскейлим все кадры
python inference_realesrgan.py -i frames/ -o frames_upscaled/ -n RealESRGAN_x4plus --outscale 2

# 3. Собираем обратно в видео
ffmpeg -framerate 30 -i frames_upscaled/%06d_out.png \
    -c:v libx264 -crf 18 -pix_fmt yuv420p output.mp4

# 4. Добавляем звук из оригинала
ffmpeg -i output.mp4 -i input.mp4 -c:v copy -c:a aac -map 0:v -map 1:a final.mp4

Скорость обработки видео

GPU Real-ESRGAN 2× (1080p→2160p) Real-ESRGAN 4× (720p→2880p)
RTX 3060 12GB ~3 fps ~1 fps
RTX 3090 24GB ~8 fps ~3 fps
RTX 4090 24GB ~15 fps ~5 fps
A100 80GB ~12 fps ~4 fps

10-минутное видео 1080p → 4K на RTX 4090: ~30 минут.

Сравнение производительности

Метод GPU Время (1 изображение 1024→4096)
Real-ESRGAN RTX 3060 ~3 сек
Real-ESRGAN RTX 4090 ~0.5 сек
SD Upscale (20 steps) RTX 3060 ~60 сек
SD Upscale (20 steps) RTX 4090 ~15 сек
Tiled SD (512px tiles) RTX 3060 (8GB) ~120 сек
Tiled SD (512px tiles) RTX 4090 ~30 сек

Docker-деплой для пакетной обработки

# docker-compose.yml
services:
  upscaler:
    image: python:3.11
    volumes:
      - ./input:/data/input
      - ./output:/data/output
    deploy:
      resources:
        reservations:
          devices:
            - driver: nvidia
              count: 1
              capabilities: [gpu]
    command: >
      bash -c "pip install realesrgan &&
      python -c 'from realesrgan.utils import RealESRGANer; print(\"Ready\")' &&
      python inference_realesrgan.py -i /data/input -o /data/output -n RealESRGAN_x4plus --outscale 4"

Выбор GPU для апскейлинга

Задача Рекомендуемый GPU Примечания
Разовый апскейлинг фото Любой GPU 4+ ГБ Real-ESRGAN
Пакетная обработка фото RTX 3060 / RTX 4060 Скорость важна
SD Upscale для арта RTX 4060 8GB+ Нужен VRAM для SD
Апскейлинг видео RTX 3090 / RTX 4090 Скорость × тысячи кадров
Коммерческая обработка A100 / H100 Максимальная производительность

Итог

Сценарий Лучший инструмент
Быстрый апскейлинг фото Real-ESRGAN
Максимальное качество (арт) ComfyUI Tiled Upscale
Апскейлинг видео Real-ESRGAN Video
Без технических знаний Topaz Gigapixel AI
Пакетная обработка Real-ESRGAN + скрипт

Для большинства задач Real-ESRGAN — лучший баланс скорости и качества. Для максимального результата — комбинация ESRGAN + SD Upscale в ComfyUI.


Нужен мощный GPU для апскейлинга? Арендуйте GPU-сервер в облаке Intelion — мощные видеокарты для обработки изображений и видео.

Гайды

#GPU

#ComfyUI

#Stable Diffusion

#генерация изображений

#апскейлинг

#ESRGAN

#Real-ESRGAN