NVIDIA RTX 4090 48GB
NVIDIA Ada Lovelace

RTX 4090 48GB
запускайте модели
до 70B параметров
от 70₽/час

Серверы с RTX 4090 48GB
Запуск за 5 минут
Оплата в рублях

Серверы расположены на территории РФ (Самарская обл.)

Популярные задачи наших клиентов

Дообучение нейросетей

Fine-tuning моделей до 30B параметров через QLoRA и полное обучение моделей до 13B в FP16. 48 ГБ VRAM позволяют работать с большими батчами и длинными контекстами без выгрузки на CPU.

Тензорные ядра 4-го поколения с поддержкой FP8 обеспечивают до 660 TFLOPS — в 2× больше, чем у RTX 3090.

Инференс LLM

Запуск LLaMA 70B в 4-bit квантизации целиком в VRAM или нескольких моделей 7B–13B одновременно. 48 ГБ памяти снимают ограничения стандартной RTX 4090 на 24 ГБ.

16 384 ядра CUDA и архитектура Ada Lovelace обеспечивают высокую скорость генерации токенов при низкой стоимости за запрос.

Генерация медиа

SDXL, FLUX и видеомодели без квантизации и с высоким разрешением. 48 ГБ VRAM позволяют загрузить базовую модель, refiner и LoRA-адаптеры одновременно без перезагрузки.

RTX 4090 генерирует изображение SDXL 1024×1024 за 6 секунд — быстрее любой другой потребительской карты.

Другая задача? RTX 4090 48GB — мощная карта на Ada Lovelace, которая справится и с ней.

4 шага до запуска

Как арендовать сервер с RTX 4090

От регистрации до запуска — меньше 10 минут. Без звонков менеджеру и подписания договоров.

1

Соберите сервер

Выберите GPU, объем диска, операционную систему и тариф в конфигураторе.

2

Создайте аккаунт

Простая регистрация через Яндекс-ID, Т-Банк или электронную почту.

3

Пополните баланс

Картой или по счёту для юрлиц. Средства зачисляются мгновенно.

Запустите сервер

И он будет готов через пару минут. Подключайтесь по SSH, RDP или прямо в браузере.

Платите только за время

Остановите сервер в любой момент и неиспользованные деньги вернутся на баланс.

Скидки за долгий срок аренды

При аренде от 3-х месяцев вы получаете скидку от 5% до 25%.

Смена конфига на лету

Начните с CPU‑сервера, затем подключите RTX 4090 для тяжёлых задач.

Какие модели запускаются на RTX 4090 48GB

48 ГБ GDDR6X и Ada Lovelace — помещаются даже 70B-модели в квантизации.
Вот что помещается на одну карту.

Большие языковые модели (LLM)

Llama 3.1 8B~16 ГБ

Инференс и дообучение в FP16. ~95-150 tok/s на RTX 4090 (Ollama / llama.cpp).

33%
DeepSeek-R1-Distill 14B~28 ГБ

Инференс в FP16 без квантизации — невозможно на 24 ГБ. ~59 tok/s (Ollama). Рассуждения уровня o1.

58%
Mistral Small 3.1 24B~30 ГБ INT8

INT8 на 48 ГБ вместо INT4 на 24 ГБ — выше качество. Конкурирует с моделями 70B.

63%
Qwen 2.5 32B~38 ГБ INT8

INT8 помещается на 48 ГБ (невозможно на 24 ГБ). Лидер для кода и мультиязычных задач, ~34 tok/s.

79%
Llama 3.3 70B~40 ГБ INT4

Эталонная 70B в INT4 помещается на 48 ГБ — невозможно на 24 ГБ. ~12 tok/s.

83%
DeepSeek-R1 671B16× GPU

Полная модель-рассуждение (MoE). Требует кластер из 16+ карт — поможем настроить.

16 GPU

Генерация изображений

FLUX.1 dev~33 ГБ

Лидер open-source генерации. 12B параметров, ~15 сек/изобр. 48 ГБ — запас для LoRA-дообучения.

69%
Stable Diffusion 3.5~18 ГБ

Новейшая SD-модель. ~4 сек/изображение на RTX 4090. TensorRT ускоряет в 2.3×.

38%
Wan 2.1 14B~24 ГБ

Генерация видео 480p-720p. 48 ГБ позволяет 720p без offloading — невозможно на 24 ГБ.

50%

Видео и аудио

HunyuanVideo 13B~36 ГБ

Генерация видео 720p, 24 fps. 48 ГБ — рекомендуемый объём без квантизации.

75%
Whisper V3 Turbo~4 ГБ

Распознавание речи 99+ языков. 10 мин аудио за 8 сек. В 6 раз быстрее V3.

8%
F5-TTS~6 ГБ

Синтез речи с клонированием голоса. 335M параметров, RTF 0.15 — 7× скорость реального времени.

13%
Помещается на 1 карту
Требует квантизацию
Нужен кластер

RTX 4090 48GB: под капотом

Ada Lovelace · 4 нм · 76,3 млрд транзисторов
NVIDIA RTX 409048 GB GDDR6X

Видеопамять

48 ГБ GDDR6X

Скорость шины

1 008 ГБ/с

CUDA-ядра

16 384

Тензорные ядра

512 (4-е поколение)

FP16 / BF16

165 TFLOPS

FP8 Tensor

660 TFLOPS

Ключевые технологии

FP8 (4-е поколение Tensor Cores)

660 TFLOPS в FP8 — в 2× больше, чем RTX 3090 в FP16

RT Cores 3-го поколения

Аппаратная трассировка лучей, в 2× быстрее предыдущего поколения

DLSS 3

Генерация кадров на основе AI для рендеринга и визуализации

AV1 Hardware Encode

Аппаратное кодирование видео в AV1 для стриминга и транскодирования

Выберите конфигурацию сервера

Укажите параметры и запустите сервер за несколько минут

1× RTX 4090
48ГБ VRAM · 32ГБ DDR4 · 18 vCPU
2× RTX 4090
96ГБ VRAM · 128ГБ DDR4 · 38 vCPU
2× RTX 4090
96ГБ VRAM · 200ГБ DDR4 · 38 vCPU
3× RTX 4090
144ГБ VRAM · 300ГБ DDR4 · 58 vCPU
4× RTX 4090
192ГБ VRAM · 400ГБ DDR4 · 76 vCPU
Операционная система
Сетевой диск (NVMe), Гб
512
Сумма предоплаты
При первом запуске потребуется полная сумма предоплаты. Для повторных запусков достаточно любой положительной суммы на балансе.
1 месяц
После остановки сервера неиспользованный остаток вернётся на баланс
3 месяцаСкидка 8 %
После остановки сервера неиспользованный остаток вернётся на баланс
6 месяцевСкидка 15 %
После остановки сервера неиспользованный остаток вернётся на баланс
12 месяцевСкидка 25 %
После остановки сервера неиспользованный остаток вернётся на баланс

Цены указаны с учётом НДС 22%

Выберите конфигурацию сервера

Укажите параметры и запустите сервер за несколько минут

Другие видеокарты

Тестовый запуск

Тестовый период
для бизнеса

Мы уверены в железе — поэтому даём потестировать до покупки.
Подключитесь по ЭДО, напишите в Telegram, и мы обсудим условия тестового запуска.

Как получить:

  • 1 Подключитесь к нам по ЭДО
  • 2 Напишите нам в Telegram
  • 3 Получите сервер с RTX 4090

Данные для подключения по ЭДО:

Оператор: АО «Калуга Астрал»

ID: 2AEE383BDF8-E70C-4F74-9E7E-995E8AC21999

Написать в Telegram

Почему арендуют у нас

Серверы работают , мы следим

Мониторинг оборудования 24/7. Серверы работают в российском дата-центре уровня Tier III, а неисправный компонент заменим по гарантии без доплат.

Платите только за вычисления

Посекундная тарификация. Выключили сервер — счётчик остановился, данные на диске сохраняются. Скидки до 25% при оплате за 12 месяцев.

Поддержка, а не тикет-система

Сразу инженер, который разбирается в CUDA, PyTorch и настройке Ada Lovelace. Поможем с FP8-квантизацией, TensorRT-LLM и подбором окружения. Ответ — до 15 минут.

Вопросы и ответы

От 1 часа. Тарификация посекундная — выключили сервер, деньги не списываются. Данные на NVMe-диске сохраняются до следующего запуска.

По SSH (Linux) или RDP (Windows). Также доступна VNC-консоль прямо в личном кабинете — можно работать через браузер без установки клиента.

Ubuntu 22.04 LTS, Ubuntu 24.04 LTS, Debian 12, CentOS Stream 9, Windows Server 2022. Все образы идут с предустановленными CUDA, драйверами NVIDIA и Docker.

Картой или по счёту для юрлиц. Скидки при оплате вперёд: 3 мес — 8%, 6 мес — 15%, 12 мес — 25%. Цены указаны с учётом НДС.

Да, для юрлиц. Подключитесь к нам по ЭДО и напишите в Telegram — обсудим условия тестового запуска на сервере с RTX 4090 48GB.

От 1 до 4 карт RTX 4090 48GB на одном сервере. Количество vCPU, RAM и объём NVMe масштабируются вместе с GPU — конфигуратор покажет доступные варианты.

Да. NVMe-диск привязан к серверу — при остановке данные остаются на месте. Деньги за остановленный сервер не списываются, неиспользованный остаток возвращается на баланс.

Да, живая поддержка в Telegram. Отвечает инженер, который разбирается в CUDA, PyTorch и настройке GPU-серверов. Среднее время ответа — до 15 минут.

48 ГБ видеопамяти. От 70₽ в час.
Запуск за 5 минут.