Question 1

Какая последняя версия PyTorch и что в ней нового?

Accepted Answer

Стабильная — PyTorch 2.11 (март 2026). Основное: CUDA 13 как default, FlexAttention с FlashAttention‑4 backend на Hopper/Blackwell (1.2–3.2× к Triton), Differentiable Collectives для distributed‑тренировки, расширенный MPS на Apple Silicon, поддержка Python 3.10–3.14. TorchScript объявлен legacy — переход на torch.export. Релизы — на GitHub.

Question 2

Можно ли использовать PyTorch в коммерческих продуктах?

Accepted Answer

Да. PyTorch распространяется под BSD‑3‑Clause — одна из самых либеральных open‑source лицензий. Можно встраивать в коммерческий продукт, продавать, модифицировать без обязательства открывать исходники. Проект под управлением PyTorch Foundation (Linux Foundation).

Question 3

Какой GPU оптимален под PyTorch?

Accepted Answer

Для большинства задач — A100 80 ГБ: влезает Llama‑3‑8B fine‑tune в bf16, LoRA на 70B через FSDP, инференс LLM до 70B в Q4. Для inference и небольшого fine‑tuning — RTX 4090 48 ГБ. Для CV и эмбеддингов — A10 24 ГБ.

Question 4

Что такое torch.compile и когда его использовать?

Accepted Answer

torch.compile(model) — JIT‑компиляция через TorchInductor: модель трассируется в граф, fused‑операции группируются, генерируется оптимизированный CUDA/CPU код. Ускорение тренировки на 10–60%, особенно ощутимо на больших моделях. Использовать всегда в production. В research иногда выключают для удобства отладки eager‑mode.

Question 5

FSDP1 или FSDP2 — что выбрать?

Accepted Answer

FSDP2 (актуальная версия). Per‑parameter sharding вместо flatten+chunk, нативная совместимость с torch.compile, sharded state dicts, проще API. FSDP1 объявлен legacy. Для новых проектов — только FSDP2 (torch.distributed.fsdp.fully_shard). TorchTitan и TorchTune — на FSDP2.

Question 6

Сколько времени займёт запуск сервера и установка PyTorch?

Accepted Answer

Сервер готов за 3–5 минут после оплаты. NVIDIA‑драйверы и CUDA уже предустановлены в наших образах Ubuntu 24. Установка PyTorch 2.11 через pip — 2–4 минуты (основная задержка — скачивание CUDA‑зависимостей ~3 ГБ). Через NGC Docker — 5–10 минут на pull образа. SSH‑инструкция — здесь.

Question 7

Подходит ли A100 80GB для тренировки Llama‑3‑70B?

Accepted Answer

Одной A100 80GB — нет (нужно ~140 ГБ под bf16 + оптимизатор). Через QLoRA (4‑bit base + LoRA) — да, fine‑tuning влезает на одну A100 80GB. Для full fine‑tune нужен кластер из 4–8× A100 с FSDP2 + Tensor Parallel. Под inference Llama‑70B в Q4 — одной A100 80GB достаточно.

Question 8

Какая оплата и можно ли остановить сервер?

Accepted Answer

Посекундная оплата: платите за каждую секунду работы. Остановили сервер — счётчик GPU замер. Диск сохраняется отдельно (~2 ₽/час за 256 ГБ), включая venv с PyTorch и веса моделей. Возобновили работу — состояние сохранено. Неиспользованный остаток возвращается на баланс.

Question 9

Можно ли работать от юрлица и получить закрывающие документы?

Accepted Answer

Да. Работаем с ООО/ИП по договору, оплата по счёту, НДС, ЭДО через Диадок/СБИС. Реквизиты для ЭДО — в блоке «Тестовый период для бизнеса». При большом объёме — индивидуальные условия и резерв GPU.

Question 10

FlashAttention — нужно ставить отдельно или есть из коробки?

Accepted Answer

Из коробки через torch.nn.functional.scaled_dot_product_attention (SDPA) — PyTorch автоматически выбирает FlashAttention‑2 backend. Для FlashAttention‑3 на Hopper (H100) ставится отдельно: pip install flash-attn --no-build-isolation (нужен CUDA ≥ 12.3, рекомендуется 12.8). Для произвольных attention‑масок используйте FlexAttention — в PyTorch 2.11 на Hopper/Blackwell он автоматически использует FlashAttention‑4 backend (1.2–3.2× к Triton).

Question 11

Поддержка ROCm / AMD GPU есть?

Accepted Answer

Да, PyTorch официально поддерживает AMD GPU через ROCm 6.x — ставится с соответствующего --index-url на download.pytorch.org/whl. Однако в Intelion Cloud парк — NVIDIA (A100, H100, RTX 4090, A10, RTX 3090). Под AMD под запрос.

Question 12

Данные тренировки не утекут наружу?

Accepted Answer

Нет. PyTorch — open‑source, работает полностью локально на сервере в РФ (Самарская обл.). Никакой телеметрии или отправки данных в Meta/PyTorch Foundation. Веса моделей и датасеты остаются на вашем диске. Для изолированного контура поддержка настроит VPC.

Аренда GPU для PyTorch
запуск за 5 минут,
от 168 ₽/час

Популярные задачи наших клиентов

Pre-training больших моделей

Fine-tuning LLM (LoRA / QLoRA)

Тренировка CV-моделей

Как арендовать сервер с Tesla A100

Соберите сервер

Создайте аккаунт

Пополните баланс

Запустите сервер

Платите только за время

Скидки за долгий срок аренды

Смена конфига на лету

Что умеет PyTorch

torch.compile — JIT-компиляция графа

FSDP2 — шардирование параметров

Distributed training — DDP, TP, PP

FlexAttention с FlashAttention‑4

Mixed Precision — BF16, FP16, FP8

Экосистема: TorchVision, TorchAudio, TorchTune

CUDA 13, ROCm 6, MPS, XPU

Production: TorchScript, ONNX, AOTInductor

Запустите одной командой

Выберите конфигурацию сервера

Тестовый период
для бизнеса

Почему арендуют у нас

Серверы работают , мы следим

Платите только за вычисления

Поддержка, а не тикет-система

Вопросы и ответы

PyTorch на вашем GPU
От 168 ₽/час, посекундная оплата.

Аренда GPU для PyTorch запуск за 5 минут, от 168 ₽/час