Question 1

Чем Axolotl отличается от Hugging Face TRL и LLaMA-Factory?

Accepted Answer

TRL — низкоуровневая библиотека Hugging Face, нужно писать свой Python‑скрипт. LLaMA-Factory — близкий аналог с GUI, но меньше методов RL. Axolotl — единый YAML, самый широкий набор методов (LoRA/QLoRA/FFT/DPO/ORPO/KTO/GRPO/RM/PRM), production-pipeline. Если YAML‑конфиг важнее GUI — выбирай Axolotl. Для чистого LoRA на одну GPU без RL — посмотри также Unsloth (быстрее, но методов меньше).

Question 2

Какой GPU нужен под Axolotl?

Accepted Answer

Зависит от модели и метода:• LoRA 7-8B (bf16) — RTX 3090 24 ГБ или A10 24 ГБ• LoRA 13-14B (bf16) — RTX 4090 48 ГБ• QLoRA 70B (4-bit) — A100 80 ГБ• Full fine-tuning 70B — 8×A100 80 ГБ через DeepSpeed ZeRO-3• Full fine-tuning 8B (bf16) — A100 80 ГБ или 2×4090 48 ГБ.

Question 3

Можно ли использовать Axolotl в коммерческом продукте?

Accepted Answer

Да. Axolotl лицензирован под Apache 2.0 — можно использовать в коммерческой разработке, модифицировать, встраивать в собственные пайплайны без раскрытия кода. Лицензия модели — отдельный вопрос (Llama 3 — Llama Community License, Qwen — Apache 2.0, Gemma — Gemma Terms of Use).

Question 4

Какие модели поддерживает Axolotl?

Accepted Answer

Все основные open-weight семейства: Llama 3/3.1/3.3/4, Qwen 2.5 / 3 / 3.5 / 3 Next (включая Coder и 2.5‑VL), Mistral / Mixtral / Ministral / Magistral, Gemma 3n/4, Phi, GPT‑OSS, DeepSeek V2/V3/R1, Granite 4, Jamba, HunYuan. Новые модели обычно появляются в течение недели после релиза.

Question 5

Сколько длится обучение типичного LoRA?

Accepted Answer

Очень зависит от датасета и модели. Ориентир для 1×A100 80 ГБ:
• Llama-3 8B + LoRA, 5K примеров, 3 эпохи — 2–4 часа
• Llama-3 8B + LoRA, 50K примеров, 3 эпохи — 20–40 часов
• Qwen 3 14B + LoRA, 10K примеров, 3 эпохи — 8–16 часов
• Llama-3.3 70B + QLoRA, 10K примеров, 3 эпохи — 30–60 часов
Sample packing включён по умолчанию — без него сроки в 2–5× больше.

Question 6

Поддерживает ли Axolotl multi-node обучение?

Accepted Answer

Да, через DeepSpeed + accelerate или FSDP. На наших серверах multi-node не нужен — 8×A100 80 ГБ или 8×H100 на одной ноде закрывают full fine-tuning 70B моделей. Для больших задач свяжитесь с поддержкой — соберём InfiniBand‑кластер.

Question 7

Сколько занимает запуск сервера с Axolotl?

Accepted Answer

Сервер готов за 3–5 минут после оплаты. Установка Axolotl в venv с FlashAttention и DeepSpeed — 10–15 минут (сборка flash-attn под вашу CUDA). Через Docker‑образ axolotlai/axolotl — 3–5 минут (только pull). Скачивание весов с Hugging Face — 1–10 минут на гигабитном канале. Итого 10–25 минут до старта первой эпохи.

Question 8

Как сохранить и проверить дообученную модель?

Accepted Answer

Axolotl пишет адаптеры в output_dir из YAML (по умолчанию ./outputs/lora-out/). Команда axolotl inference config.yml --lora_model_dir=./outputs/lora-out запускает интерактивный чат для проверки. Слияние LoRA с базовой моделью — axolotl merge-lora config.yml. Готовый чекпоинт грузится в vLLM или Ollama для production inference.

Question 9

Можно сохранить датасет и веса между сессиями?

Accepted Answer

Да. Диск сервера сохраняется отдельно от GPU‑часов (~2 ₽/час за 256 ГБ). Останавливаете сервер — счётчик GPU замирает, диск с весами и кешем датасетов остаётся. Стартуете снова — продолжаете с того же места. Чекпоинты можно и нужно дополнительно выгружать на Hugging Face Hub или в S3 — флаги hub_model_id и push_to_hub в YAML.

Question 10

Работает ли Axolotl с юрлицом, нужны закрывающие документы?

Accepted Answer

Да. Работаем с ООО/ИП по договору, оплата по счёту, НДС, ЭДО через Диадок/СБИС. В блоке «Тестовый период для бизнеса» — оператор и ID для ЭДО. Серверы стоят в РФ (Самарская обл.), ваши датасеты и веса не покидают периметр.

Аренда GPU для Axolotl
запуск за 5 минут,
от 168 ₽/час

Популярные задачи наших клиентов

Instruction tuning под свой домен

DPO / ORPO alignment

GRPO для reasoning‑моделей

Как арендовать сервер с Tesla A100

Соберите сервер

Создайте аккаунт

Пополните баланс

Запустите сервер

Платите только за время

Скидки за долгий срок аренды

Смена конфига на лету

Что умеет Axolotl

Единый YAML‑конфиг

Все методы в одном инструменте

DeepSpeed и FSDP из коробки

FlashAttention 2/3/4 + Liger Kernels

Препроцессинг датасетов

Поддержка всех популярных моделей

Sample packing и multipack

Docker и accelerate launch

Запустите одной командой

Выберите конфигурацию сервера

Тестовый период
для бизнеса

Почему арендуют у нас

Серверы работают , мы следим

Платите только за вычисления

Поддержка, а не тикет-система

Вопросы и ответы

Axolotl на вашем GPU
От 168 ₽/час, посекундная оплата.

Аренда GPU для Axolotl запуск за 5 минут, от 168 ₽/час