ByteDance · Apache 2.0 / CC BY‑NC · depth

Аренда GPU для Depth Anything 3
запуск за 5 минут,
от 79 ₽/час

Foundation‑модель monocular и multi‑view depth estimation от ByteDance. Single‑image, любые ракурсы, metric depth — один transformer на DINOv2.

Серверы в РФ (Самарская обл.) Оплата картой РФ, СБП, по счёту

Популярные задачи наших клиентов

ControlNet‑Depth для SDXL / FLUX

DA3‑Large даёт чище и стабильнее карту глубины, чем MiDaS / ZoeDepth — лучший контроль композиции в diffusion‑моделях.

3D‑реконструкция и .glb экспорт

Multi‑view inference восстанавливает геометрию сцены из 2–64 кадров без known poses. Прямой экспорт в .glb / .ply / Gaussian splat.

Metric depth для AR/VR и robotics

DA3METRIC‑Large отдаёт абсолютные метры — не относительную глубину. Подходит для измерений, навигации, SLAM.

Другая задача? Напишите нам — подберём конфигурацию.

4 шага до запуска

Как арендовать сервер с RTX 4090

От регистрации до запуска — меньше 10 минут. Без звонков менеджеру и подписания договоров.

1

Соберите сервер

Выберите GPU, объем диска, операционную систему и тариф в конфигураторе.

2

Создайте аккаунт

Простая регистрация через Яндекс-ID, Т-Банк или электронную почту.

3

Пополните баланс

Картой или по счёту для юрлиц. Средства зачисляются мгновенно.

Запустите сервер

И он будет готов через пару минут. Подключайтесь по SSH, RDP или прямо в браузере.

Платите только за время

Остановите сервер в любой момент и неиспользованные деньги вернутся на баланс.

Скидки за долгий срок аренды

При аренде от 3-х месяцев вы получаете скидку от 5% до 25%.

Смена конфига на лету

Начните с CPU‑сервера, затем подключите GPU для тяжёлых задач.

Какую версию выбрать

DA3‑Small

0.08B (80M)Any‑view · ViT‑S

Самый лёгкий вариант. ~60–80 FPS на RTX 4090 в 518×518. Apache 2.0 — можно в продукт.

VRAM (bf16):
~1 ГБ
VRAM (4-bit):
~0.5 ГБ

Любая GPU от 8 ГБ (RTX 3060, A10)

DA3‑Base

0.12B (120M)Any‑view · ViT‑B

Баланс качества и скорости. Apache 2.0. Для production single‑view inference на 24 ГБ.

VRAM (bf16):
~2 ГБ
VRAM (4-bit):
~1 ГБ

RTX 3090 / A10 24 ГБ

Флагман

DA3‑Large

0.35B (350M)Any‑view · ViT‑L

Эталонное качество any‑view. Лицензия CC BY‑NC 4.0 — research / non‑commercial.

VRAM (bf16):
~6 ГБ
VRAM (4-bit):
~2 ГБ

RTX 4090 24/48 ГБ, A100 80 ГБ

DA3‑Giant

1.15BAny‑view · ViT‑G

Максимальная точность multi‑view 3D‑реконструкции. CC BY‑NC 4.0. Контекст до 64 кадров.

VRAM (bf16):
~18 ГБ
VRAM (4-bit):
~6 ГБ

RTX 4090 48 ГБ / A100 80 ГБ

DA3METRIC‑Large

0.35BMetric depth · ViT‑L

Абсолютные метры, не относительная глубина. Apache 2.0. Для AR/VR, robotics, измерений.

VRAM (bf16):
~6 ГБ
VRAM (4-bit):
~2 ГБ

RTX 4090 24/48 ГБ

DA3MONO‑Large

0.35BMonocular · ViT‑L

Дистиллированный single‑image вариант. Apache 2.0. Прямой апгрейд Depth Anything V2.

VRAM (bf16):
~6 ГБ
VRAM (4-bit):
~2 ГБ

RTX 4090 24/48 ГБ

DA3NESTED‑Giant‑Large

1.15B + 0.35BNested (any‑view + metric)

Связка Giant any‑view + metric‑head. Реальный масштаб + multi‑view consistency.

VRAM (bf16):
~24 ГБ
VRAM (4-bit):
~8 ГБ

RTX 4090 48 ГБ / A100 80 ГБ

4 способа запуска

Запустите одной командой

После создания сервера подключитесь по SSH и выберите подходящий инструмент.

Официальный способ от ByteDance. Поддерживает any‑view inference, экспорт в .glb / .ply / .npz / Gaussian splat. Требуется CUDA 12.x, PyTorch ≥ 2.4.

# Ubuntu 24.04, CUDA 12.x, Python 3.11
python3 -m venv /opt/da3 && source /opt/da3/bin/activate
pip install torch torchvision xformers \
  --index-url https://download.pytorch.org/whl/cu128
git clone https://github.com/ByteDance-Seed/Depth-Anything-3.git
cd Depth-Anything-3 && pip install -e .
# Скачаем тестовое изображение (или положите свои scene*.jpg):
wget -q -O scene1.jpg https://ultralytics.com/images/bus.jpg
wget -q -O scene2.jpg https://ultralytics.com/images/zidane.jpg
# Inference:
python3 - <<'PY'
from depth_anything_3.api import DepthAnything3
model = DepthAnything3.from_pretrained('depth-anything/DA3-LARGE').cuda()
out = model.inference(['scene1.jpg', 'scene2.jpg'],
                      export_dir='out', export_format='glb')
print(out.depth.shape, out.intrinsics.shape)
PY
Запустить Depth Anything 3

~79 ₽/час · посекундная оплата

Выберите конфигурацию сервера

Укажите параметры и запустите сервер за несколько минут

Тестовый запуск

Тестовый период
для бизнеса

Мы уверены в железе — поэтому даём потестировать до покупки.
Подключитесь по ЭДО, напишите нам, и мы обсудим условия тестового запуска.

Как получить:

  • 1 Подключитесь к нам по ЭДО
  • 2 Напишите нам
  • 3 Получите сервер с RTX 4090

Данные для подключения по ЭДО:

Оператор: АО «Калуга Астрал»

ID: 2AEE383BDF8-E70C-4F74-9E7E-995E8AC21999

Написать нам

Почему арендуют у нас

Серверы работают , мы следим

Мониторинг оборудования 24/7. Неисправный компонент заменим по гарантии без доплат.

Платите только за вычисления

Посекундная тарификация. Выключили сервер — счётчик остановился, данные на диске сохраняются. Скидки до 25% при оплате за 12 месяцев.

Поддержка, а не тикет-система

Сразу инженер, который разбирается в CUDA, PyTorch и настройке GPU-серверов. Ответ — до 15 минут.

Вопросы и ответы

DA3 — multi‑view, DA2 — только single image. DA3 принимает от 1 до 64 кадров без known camera poses и выдаёт согласованную геометрию + камеры + depth. Архитектура — один plain ViT на DINOv2 без специальных head'ов. На monocular‑тестах DA3 обходит DA2 при сопоставимой скорости.

Для ControlNet‑Depth и быстрых пайплайновDA3‑Base (0.12B, Apache 2.0, ~55 FPS на 4090). Для качественного single‑image — DA3MONO‑Large. Для 3D‑реконструкции из видеоDA3‑Large или Giant. Для измерений в метрах — DA3METRIC‑Large.

Лицензии разные. DA3‑Small, Base, Metric‑Large, Mono‑Large — Apache 2.0: можно встраивать в продукт, продавать, модифицировать. DA3‑Large и Giant — CC BY‑NC 4.0 (только research / non‑commercial). Для production выбирайте Apache‑варианты или контактируйте ByteDance.

Для single‑image inference 24 ГБ хватит даже под Giant.RTX 3090 вытянет Small / Base / Mono‑Large без проблем. RTX 4090 48 ГБ нужна для multi‑view (64 кадра одновременно), fine‑tuning и production batch‑инференса. Для тяжёлой 3D‑реконструкции — A100 80 ГБ.

Пока нет — на момент мая 2026 интеграция в issue #182 в ByteDance‑Seed/Depth‑Anything‑3. Используйте официальный пакет depth_anything_3.api или ComfyUI‑DepthAnythingV3. Если нужен pipeline('depth-estimation') — рабочий fallback на Depth Anything V2 (depth-anything/Depth-Anything-V2-Large-hf).

Точных цифр производитель не публикует. По нашим приблизительным замерам в разрешении 518×518, bf16, batch 1 на RTX 4090: DA3‑Small — десятки FPS, Base — порядка 50 FPS, Large / Mono‑Large — 20–30 FPS, Giant — около 10 FPS. Multi‑view делит FPS пропорционально числу кадров. С torch.compile и xformers — ещё +20–30%.

Да. DA3 заменяет MiDaS / ZoeDepth в ControlNet‑Depth пайплайнах: получается чище фон, корректнее тонкие объекты (волосы, провода), стабильнее multi‑view. В ComfyUI используется нода DepthAnythingV3Loader → стандартный ControlNet apply node для FLUX или SDXL.

Для дообучения на собственном датасете — A100 80 ГБ минимум: ViT‑L бэкбон + DPT decoder + кеш активаций просят 40–60 ГБ в bf16. Для ViT‑Small/Base подойдёт RTX 4090 48 ГБ с gradient checkpointing.

DA3METRIC‑Large отдаёт абсолютные метры — обучен на metric‑датасетах с известным масштабом. Базовые DA3‑Small/Base/Large/Giant выдают относительную глубину (как MiDaS). Для AR/VR, измерений, robotics берите Metric или NESTED‑Giant‑Large, который комбинирует multi‑view + metric.

Сервер готов за 3–5 минут после оплаты. Установка зависимостей и веса DA3 (~700 МБ Large, ~2.3 ГБ Giant) — ещё 2–4 минуты. Итого 5–10 минут до первого depth‑map'а. Посекундная тарификация: остановили сервер — счётчик замер, диск ~2 ₽/час. Подключение по SSH — в инструкции.

Нет. Мы запускаем open‑weight веса локально на серверах в РФ (Самарская обл.). Модель не отправляет данные наружу. Для изолированного контура — поддержка настроит VPC‑подключение.

Да. Работаем с ООО/ИП по договору, оплата по счёту, НДС, ЭДО через Диадок/СБИС. Для тестового периода — оператор и ID для ЭДО в блоке заявки.

Depth Anything 3 на вашем GPU
От 79 ₽/час, посекундная оплата.

Оплата в рублях, посекундно. Поддержка 24/7. Запуск за 5 минут.