Question 1

Чем Depth Anything 3 отличается от V2?

Accepted Answer

DA3 — multi‑view, DA2 — только single image. DA3 принимает от 1 до 64 кадров без known camera poses и выдаёт согласованную геометрию + камеры + depth. Архитектура — один plain ViT на DINOv2 без специальных head'ов. На monocular‑тестах DA3 обходит DA2 при сопоставимой скорости.

Question 2

Какой вариант DA3 выбрать под мою задачу?

Accepted Answer

Для ControlNet‑Depth и быстрых пайплайнов — DA3‑Base (0.12B, Apache 2.0, ~55 FPS на 4090). Для качественного single‑image — DA3MONO‑Large. Для 3D‑реконструкции из видео — DA3‑Large или Giant. Для измерений в метрах — DA3METRIC‑Large.

Question 3

Какая лицензия и можно ли в коммерческий продукт?

Accepted Answer

Лицензии разные. DA3‑Small, Base, Metric‑Large, Mono‑Large — Apache 2.0: можно встраивать в продукт, продавать, модифицировать. DA3‑Large и Giant — CC BY‑NC 4.0 (только research / non‑commercial). Для production выбирайте Apache‑варианты или контактируйте ByteDance.

Question 4

Хватит ли RTX 3090 24 ГБ или нужна 4090 48 ГБ?

Accepted Answer

Для single‑image inference 24 ГБ хватит даже под Giant. RTX 3090 вытянет Small / Base / Mono‑Large без проблем. RTX 4090 48 ГБ нужна для multi‑view (64 кадра одновременно), fine‑tuning и production batch‑инференса. Для тяжёлой 3D‑реконструкции — A100 80 ГБ.

Question 5

Работает ли DA3 в HuggingFace Transformers pipeline?

Accepted Answer

Пока нет — на момент мая 2026 интеграция в issue #182 в ByteDance‑Seed/Depth‑Anything‑3. Используйте официальный пакет depth_anything_3.api или ComfyUI‑DepthAnythingV3. Если нужен pipeline('depth-estimation') — рабочий fallback на Depth Anything V2 (depth-anything/Depth-Anything-V2-Large-hf).

Question 6

Сколько FPS на RTX 4090 в реальной задаче?

Accepted Answer

Точных цифр производитель не публикует. По нашим приблизительным замерам в разрешении 518×518, bf16, batch 1 на RTX 4090: DA3‑Small — десятки FPS, Base — порядка 50 FPS, Large / Mono‑Large — 20–30 FPS, Giant — около 10 FPS. Multi‑view делит FPS пропорционально числу кадров. С torch.compile и xformers — ещё +20–30%.

Question 7

Можно использовать DA3 для ControlNet с SDXL / FLUX?

Accepted Answer

Да. DA3 заменяет MiDaS / ZoeDepth в ControlNet‑Depth пайплайнах: получается чище фон, корректнее тонкие объекты (волосы, провода), стабильнее multi‑view. В ComfyUI используется нода DepthAnythingV3Loader → стандартный ControlNet apply node для FLUX или SDXL.

Question 8

Какой GPU нужен для fine‑tuning DA3?

Accepted Answer

Для дообучения на собственном датасете — A100 80 ГБ минимум: ViT‑L бэкбон + DPT decoder + кеш активаций просят 40–60 ГБ в bf16. Для ViT‑Small/Base подойдёт RTX 4090 48 ГБ с gradient checkpointing.

Question 9

DA3 умеет в реальные метры или только относительную глубину?

Accepted Answer

DA3METRIC‑Large отдаёт абсолютные метры — обучен на metric‑датасетах с известным масштабом. Базовые DA3‑Small/Base/Large/Giant выдают относительную глубину (как MiDaS). Для AR/VR, измерений, robotics берите Metric или NESTED‑Giant‑Large, который комбинирует multi‑view + metric.

Question 10

Сколько длится запуск сервера и как оплачивается?

Accepted Answer

Сервер готов за 3–5 минут после оплаты. Установка зависимостей и веса DA3 (~700 МБ Large, ~2.3 ГБ Giant) — ещё 2–4 минуты. Итого 5–10 минут до первого depth‑map'а. Посекундная тарификация: остановили сервер — счётчик замер, диск ~2 ₽/час. Подключение по SSH — в инструкции.

Question 11

Данные не утекут в ByteDance?

Accepted Answer

Нет. Мы запускаем open‑weight веса локально на серверах в РФ (Самарская обл.). Модель не отправляет данные наружу. Для изолированного контура — поддержка настроит VPC‑подключение.

Question 12

Есть ли поддержка ЭДО и работа с юрлицами?

Accepted Answer

Да. Работаем с ООО/ИП по договору, оплата по счёту, НДС, ЭДО через Диадок/СБИС. Для тестового периода — оператор и ID для ЭДО в блоке заявки.

Аренда GPU для Depth Anything 3
запуск за 5 минут,
от 84 ₽/час

Популярные задачи наших клиентов

ControlNet‑Depth для SDXL / FLUX

3D‑реконструкция и .glb экспорт

Metric depth для AR/VR и robotics

Как арендовать сервер с RTX 4090

Соберите сервер

Создайте аккаунт

Пополните баланс

Запустите сервер

Платите только за время

Скидки за долгий срок аренды

Смена конфига на лету

Какую версию выбрать

DA3‑Small

DA3‑Base

DA3‑Large

DA3‑Giant

DA3METRIC‑Large

DA3MONO‑Large

DA3NESTED‑Giant‑Large

Запустите одной командой

Выберите конфигурацию сервера

Тестовый период
для бизнеса

Почему арендуют у нас

Серверы работают , мы следим

Платите только за вычисления

Поддержка, а не тикет-система

Вопросы и ответы

Depth Anything 3 на вашем GPU
От 84 ₽/час, посекундная оплата.

Куда вам удобнее написать?

Аренда GPU для Depth Anything 3 запуск за 5 минут, от 84 ₽/час