Question 1

Чем DeepSeek R1 отличается от обычных LLM?

Accepted Answer

R1 — это reasoning‑модель: перед ответом она генерирует длинный блок размышлений в тегах <think>, а потом даёт ответ. Натренирована через reinforcement learning без supervised data на этапе RL. Качество математики и кода у неё ближе к OpenAI o1/o3, чем к классическим chat‑моделям. Цена за это — latency: модель «думает» 5–30 секунд на запрос.

Question 2

Какую версию выбрать, если я только начинаю?

Accepted Answer

Старт — DeepSeek‑R1‑0528‑Qwen3‑8B через Ollama. Помещается на любой GPU от 16 ГБ (RTX 3090, A10), запускается одной командой. Если нужен лучший outcome — Distill‑Qwen‑32B на A100 80 ГБ. Полный 671B флагман — только если есть 8× H200/A100.

Question 3

Можно ли использовать DeepSeek R1 в коммерческом продукте?

Accepted Answer

Да. Все веса (671B и distill 1.5B–70B) лицензированы под MIT License — можно встраивать в продукт, продавать, модифицировать, дистиллировать в свою модель. Distill‑версии на основе Llama 3 наследуют также Llama 3.x license (нужно соблюдать обе).

Question 4

Хватит ли 48 ГБ (RTX 4090) для R1‑Distill‑32B?

Accepted Answer

В bf16 — нет (нужно ~66 ГБ). В Q4_K_M (~18 ГБ) — да, с большим запасом под контекст 32K. На A100 80 ГБ — bf16 без компромиссов плюс длинный контекст. RTX 4090 48 ГБ — лучший вариант под Q4‑инференс. См. отдельный лендинг.

Question 5

Сколько GPU нужно под полный DeepSeek‑R1 (671B)?

Accepted Answer

MoE‑архитектура (37B активных параметров) даёт ~1.4 ТБ в bf16 — это 8× H200 141 ГБ или 16× A100 80 ГБ. В Q4 модель занимает ~404 ГБ — реалистично на 8× A100 80 ГБ или 6× H100 80 ГБ. Unsloth выпустила 1.58‑bit dynamic quant, который вмещается в ~140 ГБ — то есть в 2× H100/H200 или 1× B200.

Question 6

DeepSeek R1 хорошо работает с русским?

Accepted Answer

Базовый R1 (671B) — да, контекст из китайского и английского, русский на уровне Llama 3.3 70B. Distill‑версии на Qwen2.5 (7B/14B/32B) — лучше по русскому, чем Llama‑distill. Для серьёзного делового русского используй Distill‑Qwen‑32B или гибрид: распознавание на R1, генерация на Qwen3‑32B.

Question 7

Сколько длится запуск сервера с DeepSeek R1?

Accepted Answer

Сервер готов за 3–5 минут после оплаты. Дальше — установка vLLM или Ollama (~2 минуты), скачивание весов с Hugging Face: 8B distill — 1–2 минуты, 70B distill — 5–10 минут, 671B — 30–60 минут на 1 Гбит/с. Итого 5–15 минут до первого токена для distill, ~1 час для флагмана. Детали SSH‑подключения — в инструкции.

Question 8

Как отделить «размышления» от итогового ответа?

Accepted Answer

В vLLM и SGLang это делается флагом --reasoning-parser deepseek_r1. Парсер достаёт содержимое ... в отдельное поле reasoning ответа, а итоговый текст возвращает в content. Удобно для агентов: цепочка мыслей идёт в лог, ответ — в UI.

Question 9

Данные моих запросов не утекут в Китай?

Accepted Answer

Нет. Мы запускаем open‑weight веса локально на серверах в РФ (Самарская обл.). Модель не отправляет данные наружу — это просто файл с коэффициентами. Если нужен полный изолированный контур — поддержка настроит VPC‑подключение.

Question 10

Посекундная оплата — как работает?

Accepted Answer

Платите за каждую секунду работы сервера. Остановили сервер — счётчик замер, диск сохраняется отдельно (~2 ₽/час за 256 ГБ). Неиспользованный остаток возвращается на баланс. Для эксперимента с 671B разумно брать 8× H100 на 4–6 часов и сразу гасить.

Question 11

DeepSeek R1 vs OpenAI o1 API — что дешевле в месяц?

Accepted Answer

Для нагрузок выше 2–5 млн токенов в день self‑host R1 на A100 80 ГБ выгоднее API o1 в 5–15×. Для маленьких объёмов API дешевле. Точку безубыточности легко посчитать: цена o1 ≈ $15/1M output tokens, цена A100 у нас — посекундно.

Question 12

Можно с юрлица, с закрывающими документами?

Accepted Answer

Да. Работаем с ООО/ИП по договору, оплата по счёту, НДС, ЭДО через Диадок/СБИС. В блоке «Тестовый период для бизнеса» — оператор и ID для ЭДО.

Аренда GPU для DeepSeek R1
запуск за 5 минут,
от 168 ₽/час

Популярные задачи наших клиентов

Сложный reasoning и логика

Математика и научные задачи

Генерация и аудит кода

Как арендовать сервер с Tesla A100

Соберите сервер

Создайте аккаунт

Пополните баланс

Запустите сервер

Платите только за время

Скидки за долгий срок аренды

Смена конфига на лету

Какую версию выбрать

DeepSeek‑R1‑0528 (671B MoE)

DeepSeek‑R1‑Distill‑Llama‑70B

DeepSeek‑R1‑Distill‑Qwen‑32B

DeepSeek‑R1‑Distill‑Qwen‑14B

DeepSeek‑R1‑0528‑Qwen3‑8B

DeepSeek‑R1‑Distill‑Qwen‑7B

DeepSeek‑R1‑Distill‑Llama‑8B

DeepSeek‑R1‑Distill‑Qwen‑1.5B

Запустите одной командой

Выберите конфигурацию сервера

Тестовый период
для бизнеса

Почему арендуют у нас

Серверы работают , мы следим

Платите только за вычисления

Поддержка, а не тикет-система

Вопросы и ответы

DeepSeek R1 на вашем GPU
От 168 ₽/час, посекундная оплата.

Аренда GPU для DeepSeek R1 запуск за 5 минут, от 168 ₽/час