51
13 марта 2026
Апскейлинг изображений нейросетями на GPU
Как увеличить разрешение изображений с помощью ИИ: ESRGAN, Real-ESRGAN, Topaz, ComfyUI — требования к GPU и практические примеры
ИИ-апскейлинг позволяет увеличить разрешение изображения в 2–4× с сохранением деталей, которых не было в оригинале. Нейросеть «дорисовывает» текстуры, грани и мелкие элементы — результат значительно лучше, чем классический bicubic или Lanczos.
В этом гайде разберём основные инструменты, требования к GPU и практические рабочие процессы.
Методы ИИ-апскейлинга
1. ESRGAN / Real-ESRGAN
Самый популярный и простой метод. Real-ESRGAN — улучшенная версия, обученная на реальных деградациях (JPEG-артефакты, шум, размытие).
| Характеристика | Значение |
|---|---|
| Увеличение | 2× или 4× |
| VRAM | 1–4 ГБ |
| Скорость | Быстро (1–5 сек на изображение) |
| Качество | Хорошее для фото, среднее для аниме |
| Контроль | Минимальный (модель + масштаб) |
Лучше всего для: пакетного апскейлинга фотографий, видео, обложек.
2. Stable Diffusion Upscale (SD Upscaler)
Использует диффузионную модель для «перерисовки» изображения в высоком разрешении. Добавляет детали, которых не было — может как улучшить, так и «придумать» лишнее.
| Характеристика | Значение |
|---|---|
| Увеличение | 2–4× |
| VRAM | 6–12 ГБ |
| Скорость | Медленно (30–120 сек) |
| Качество | Отличное (с правильными настройками) |
| Контроль | Высокий (prompt, denoise, sampler) |
Лучше всего для: AI-арта, иллюстраций, когда нужно максимальное качество.
3. Tiled Upscale (ComfyUI / A1111)
Комбинация: сначала ESRGAN для увеличения, затем Stable Diffusion обрабатывает изображение тайлами (фрагментами), добавляя детали.
| Характеристика | Значение |
|---|---|
| Увеличение | 2–8× |
| VRAM | 8–16 ГБ (тайлами, не всё изображение сразу) |
| Скорость | Средне (2–10 мин для 4× на большом изображении) |
| Качество | Лучшее (ESRGAN + SD детализация) |
| Контроль | Высокий |
Лучше всего для: максимального качества на больших разрешениях (4K, 8K).
4. Topaz Gigapixel AI
Коммерческое решение с GUI. Простое в использовании, но закрытое и платное.
| Характеристика | Значение |
|---|---|
| Увеличение | До 6× |
| VRAM | 4–8 ГБ |
| Скорость | Средне |
| Качество | Очень хорошее |
| Цена | ~$100 (разовая) |
Лучше всего для: пользователей без технического опыта, фотографов.
Сравнение качества
| Метод | Фото | Аниме/Арт | Текст на изображении | Текстуры |
|---|---|---|---|---|
| Bicubic (без ИИ) | Мыльно | Мыльно | Мыльно | Мыльно |
| Real-ESRGAN | Хорошо | Хорошо | Средне | Хорошо |
| SD Upscaler | Отлично | Отлично | Может исказить | Отлично |
| Tiled (ESRGAN+SD) | Отлично | Отлично | Средне | Отлично |
| Topaz | Очень хорошо | Хорошо | Хорошо | Очень хорошо |
Важно: SD Upscaler может «галлюцинировать» детали — добавлять элементы, которых не было. Для документов и текста используйте ESRGAN или Topaz.
Требования к GPU
| Задача | Мин. VRAM | Рекомендуемый GPU |
|---|---|---|
| Real-ESRGAN (одно изображение) | 2 ГБ | Любой GPU |
| Real-ESRGAN (пакет / видео) | 4 ГБ | RTX 3060 |
| SD Upscaler (SDXL) | 8 ГБ | RTX 4060 |
| Tiled Upscale (SDXL) | 8 ГБ | RTX 4060 |
| Tiled Upscale (высокое качество) | 12–16 ГБ | RTX 4070 / RTX 4080 |
| Пакетная обработка / видео 4K | 16–24 ГБ | RTX 3090 / RTX 4090 |
Практика: Real-ESRGAN
Установка
pip install realesrgan
# Или клонируем репозиторий для больше контроля
git clone https://github.com/xinntao/Real-ESRGAN.git
cd Real-ESRGAN
pip install -r requirements.txt
python setup.py develop
Апскейлинг одного изображения
python inference_realesrgan.py \
-i input.jpg \
-o output/ \
-n RealESRGAN_x4plus \
--outscale 4 \
--face_enhance # Улучшение лиц (GFPGAN)
Модели Real-ESRGAN
| Модель | Для чего | Масштаб |
|---|---|---|
| RealESRGAN_x4plus | Общее назначение (фото) | 4× |
| RealESRGAN_x4plus_anime_6B | Аниме / рисунки | 4× |
| RealESRGAN_x2plus | Фото, 2× (быстрее) | 2× |
| realesr-general-x4v3 | Общее назначение v3 | 4× |
Пакетная обработка
# Все изображения из папки
python inference_realesrgan.py \
-i ./input_folder/ \
-o ./output_folder/ \
-n RealESRGAN_x4plus \
--outscale 4
Python API
from realesrgan import RealESRGANer
from basicsr.archs.rrdbnet_arch import RRDBNet
import cv2
# Инициализация
model = RRDBNet(num_in_ch=3, num_out_ch=3, num_feat=64,
num_block=23, num_grow_ch=32, scale=4)
upsampler = RealESRGANer(
scale=4,
model_path='weights/RealESRGAN_x4plus.pth',
model=model,
tile=512, # Тайлинг для экономии VRAM
tile_pad=10,
pre_pad=0,
half=True, # FP16 — быстрее и меньше VRAM
)
# Апскейлинг
img = cv2.imread('input.jpg', cv2.IMREAD_UNCHANGED)
output, _ = upsampler.enhance(img, outscale=4)
cv2.imwrite('output.png', output)
Практика: SD Upscale в ComfyUI
ComfyUI предоставляет нодовый подход к апскейлингу.
Простой пайплайн: ESRGAN + SD Refiner
- Load Image → загружаем исходное изображение
- Upscale Image (using Model) → ESRGAN 4×
- VAE Encode → кодируем в латентное пространство
- KSampler → SD обрабатывает с низким denoise (0.3–0.5)
- VAE Decode → декодируем обратно
- Save Image → сохраняем результат
Ключевые настройки
| Параметр | Значение | Эффект |
|---|---|---|
| Denoise | 0.2–0.3 | Минимальные изменения, сохраняет оригинал |
| Denoise | 0.4–0.5 | Больше деталей, но может изменить содержание |
| Denoise | 0.6+ | Сильные изменения — почти перерисовка |
| Tile size | 512–768 | Размер тайла (больше = больше VRAM) |
| Steps | 15–25 | Количество шагов сэмплинга |
Ultimate SD Upscale (кастомная нода)
Для апскейлинга больших изображений с ограниченным VRAM:
Install: ComfyUI Manager → Install Custom Nodes → UltimateSDUpscale
Эта нода автоматически разбивает изображение на тайлы, обрабатывает каждый через SD и сшивает обратно. Результат — апскейлинг до 8K+ даже на 8 ГБ VRAM.
Практика: апскейлинг видео
Real-ESRGAN для видео
python inference_realesrgan_video.py \
-i input_video.mp4 \
-o output/ \
-n realesr-animevideov3 \
--outscale 2 \
--num_process_per_gpu 2
FFmpeg + Real-ESRGAN pipeline
# 1. Извлекаем кадры
ffmpeg -i input.mp4 -qscale:v 1 -qmin 1 frames/%06d.png
# 2. Апскейлим все кадры
python inference_realesrgan.py -i frames/ -o frames_upscaled/ -n RealESRGAN_x4plus --outscale 2
# 3. Собираем обратно в видео
ffmpeg -framerate 30 -i frames_upscaled/%06d_out.png \
-c:v libx264 -crf 18 -pix_fmt yuv420p output.mp4
# 4. Добавляем звук из оригинала
ffmpeg -i output.mp4 -i input.mp4 -c:v copy -c:a aac -map 0:v -map 1:a final.mp4
Скорость обработки видео
| GPU | Real-ESRGAN 2× (1080p→2160p) | Real-ESRGAN 4× (720p→2880p) |
|---|---|---|
| RTX 3060 12GB | ~3 fps | ~1 fps |
| RTX 3090 24GB | ~8 fps | ~3 fps |
| RTX 4090 24GB | ~15 fps | ~5 fps |
| A100 80GB | ~12 fps | ~4 fps |
10-минутное видео 1080p → 4K на RTX 4090: ~30 минут.
Сравнение производительности
| Метод | GPU | Время (1 изображение 1024→4096) |
|---|---|---|
| Real-ESRGAN | RTX 3060 | ~3 сек |
| Real-ESRGAN | RTX 4090 | ~0.5 сек |
| SD Upscale (20 steps) | RTX 3060 | ~60 сек |
| SD Upscale (20 steps) | RTX 4090 | ~15 сек |
| Tiled SD (512px tiles) | RTX 3060 (8GB) | ~120 сек |
| Tiled SD (512px tiles) | RTX 4090 | ~30 сек |
Docker-деплой для пакетной обработки
# docker-compose.yml
services:
upscaler:
image: python:3.11
volumes:
- ./input:/data/input
- ./output:/data/output
deploy:
resources:
reservations:
devices:
- driver: nvidia
count: 1
capabilities: [gpu]
command: >
bash -c "pip install realesrgan &&
python -c 'from realesrgan.utils import RealESRGANer; print(\"Ready\")' &&
python inference_realesrgan.py -i /data/input -o /data/output -n RealESRGAN_x4plus --outscale 4"
Выбор GPU для апскейлинга
| Задача | Рекомендуемый GPU | Примечания |
|---|---|---|
| Разовый апскейлинг фото | Любой GPU 4+ ГБ | Real-ESRGAN |
| Пакетная обработка фото | RTX 3060 / RTX 4060 | Скорость важна |
| SD Upscale для арта | RTX 4060 8GB+ | Нужен VRAM для SD |
| Апскейлинг видео | RTX 3090 / RTX 4090 | Скорость × тысячи кадров |
| Коммерческая обработка | A100 / H100 | Максимальная производительность |
Итог
| Сценарий | Лучший инструмент |
|---|---|
| Быстрый апскейлинг фото | Real-ESRGAN |
| Максимальное качество (арт) | ComfyUI Tiled Upscale |
| Апскейлинг видео | Real-ESRGAN Video |
| Без технических знаний | Topaz Gigapixel AI |
| Пакетная обработка | Real-ESRGAN + скрипт |
Для большинства задач Real-ESRGAN — лучший баланс скорости и качества. Для максимального результата — комбинация ESRGAN + SD Upscale в ComfyUI.
Нужен мощный GPU для апскейлинга? Арендуйте GPU-сервер в облаке Intelion — мощные видеокарты для обработки изображений и видео.
#GPU
#ComfyUI
#Stable Diffusion
#генерация изображений
#апскейлинг
#ESRGAN
#Real-ESRGAN