Question 1

Какой GPU нужен для fine-tuning через Unsloth?

Accepted Answer

Зависит от модели. Llama 3.1 8B QLoRA — от 12 ГБ VRAM (RTX 3090, A10). Llama 3.1 70B QLoRA — A100 80 ГБ. Для длинного контекста (32K+) или multi-GPU тренировки 70B+ — 2-4× A100 80 ГБ. Vision-модели — A100 80 ГБ для 11B+.

Question 2

Чем Unsloth отличается от обычного HuggingFace + PEFT?

Accepted Answer

Unsloth — drop-in замена с 2× ускорением и 50-80% экономией VRAM. Использует кастомные Triton-ядра для forward/backward, smart gradient checkpointing, memory-efficient attention. API совместим — большая часть кода переносится без изменений. Численно идентичные результаты — без потери точности.

Question 3

Можно использовать Unsloth в коммерческом продукте?

Accepted Answer

Да. Unsloth лицензирован под Apache 2.0 — можно встраивать в продукт, продавать, модифицировать. Лицензия модели (Llama, Qwen, Mistral) проверяется отдельно — большинство open-weight моделей разрешают коммерческое использование.

Question 4

Какие модели поддерживаются?

Accepted Answer

Все основные open-weight LLM: Llama 3 / 3.1 / 3.2 / 3.3, Qwen2 / Qwen2.5 / Qwen3, Mistral / Mixtral, Gemma 2 / 3, Phi-3 / 3.5 / 4, DeepSeek-V3 / R1, Yi, gpt-oss. Vision: Llama 3.2 Vision, Qwen2-VL, Pixtral, LLaVA. Полный список (500+ моделей) — в model catalog.

Question 5

Сколько времени займёт LoRA на 8B модели?

Accepted Answer

Зависит от датасета. На 10K-50K примеров (типовой LoRA setup): 30 минут — 2 часа на A100 80 ГБ. На потребительской GPU 24 ГБ — 1-4 часа. QLoRA на 70B — 6-24 часа на A100 80 ГБ. DPO/GRPO работают в 1.5-2× медленнее SFT из-за двух forward-проходов.

Question 6

Поддерживается ли DPO, GRPO, RLHF?

Accepted Answer

Да. Все современные preference-методы из коробки через интеграцию с TRL: DPO, ORPO, KTO, SimPO, GRPO. GRPO — рецепт DeepSeek-R1 для развития reasoning. Достаточно поменять SFTTrainer на DPOTrainer / GRPOTrainer — остальной код работает без изменений.

Question 7

Можно экспортировать модель для Ollama / llama.cpp?

Accepted Answer

Да. Одна команда — model.save_pretrained_gguf('output_dir', tokenizer, quantization_method='q4_k_m'). Также поддерживаются Q5_K_M, Q8_0, Q3_K_M, Q2_K. Получившийся GGUF сразу загружается в Ollama (ollama create), llama.cpp, LM Studio, Text Generation WebUI.

Question 8

Сколько длится запуск GPU-сервера для Unsloth?

Accepted Answer

Сервер готов за 3-5 минут после оплаты. Образ Ubuntu 24.04 + CUDA 12.x уже готов. Установка Unsloth через pip — 5-10 минут (или 30 секунд для готового Docker-образа). Скачивание base-модели с HuggingFace — 2-15 минут в зависимости от размера. Итого 10-25 минут до первой эпохи.

Question 9

Можно ли тренировать модели на русскоязычных датасетах?

Accepted Answer

Да, Unsloth model-agnostic — работает с любым языком. Для русского лучшие base-модели — Qwen3 (14B+), Llama 3.1 / 3.3, Mistral. Для адаптации словаря под русский — embedding/lm_head LoRA или continued pretraining на русскоязычном корпусе.

Question 10

Посекундная оплата — как это работает?

Accepted Answer

Платите за каждую секунду работы сервера. Остановили сервер после тренировки — счётчик замер, диск с весами и адаптерами сохраняется отдельно (~2 ₽/час за 256 ГБ). Возобновление — за минуту. Неиспользованный остаток возвращается на баланс.

Question 11

Можно с юрлица, с закрывающими документами?

Accepted Answer

Да. Работаем с ООО/ИП по договору, оплата по счёту, НДС, ЭДО через Диадок/СБИС. Для R&D и обучающих программ — отдельные условия. В блоке «Тестовый период для бизнеса» — оператор и ID для ЭДО.

Question 12

Данные моего датасета не утекут?

Accepted Answer

Нет. Тренировка проходит локально на вашем GPU-сервере в дата-центре в РФ (Самарская обл.). Unsloth — open-source библиотека, не отправляет данные наружу. Полученные веса остаются на диске сервера до выгрузки. Для изолированного контура — поддержка настроит VPC-подключение.

Аренда GPU для Unsloth
запуск за 5 минут,
от 168 ₽/час

Популярные задачи наших клиентов

LoRA fine-tuning Qwen / Llama

QLoRA на потребительских GPU

DPO / GRPO для reasoning

Как арендовать сервер с Tesla A100

Соберите сервер

Создайте аккаунт

Пополните баланс

Запустите сервер

Платите только за время

Скидки за долгий срок аренды

Смена конфига на лету

Что умеет Unsloth

2× быстрее обучения

50-80% меньше VRAM

FlashAttention 2

Dynamic 4-bit квантизация

DPO, GRPO, ORPO, KTO

Vision LLM поддержка

Auto GGUF / Ollama экспорт

RoPE Scaling до 4×

Запустите одной командой

Выберите конфигурацию сервера

Тестовый период
для бизнеса

Почему арендуют у нас

Серверы работают , мы следим

Платите только за вычисления

Поддержка, а не тикет-система

Вопросы и ответы

Unsloth на вашем GPU
От 168 ₽/час, посекундная оплата.

Аренда GPU для Unsloth запуск за 5 минут, от 168 ₽/час