Genmo · Apache 2.0 · open-weight

Аренда GPU для Mochi 1
запуск за 5 минут,
от 168 ₽/час

Открытая T2V‑модель Genmo на 10B параметров. Лидер по качеству движения среди open‑source видеогенераторов. ComfyUI, Diffusers, native scripts.

Серверы в РФ (Самарская обл.) Оплата картой РФ, СБП, по счёту

Популярные задачи наших клиентов

Text‑to‑video — короткие клипы

Ролики 480p (848×480) при 30 fps по текстовому промпту. До 84 кадров (~2.8 сек) за один проход на H100, длинные клипы — через цепочку генераций.

Motion‑rich сцены и физика

Mochi лидирует среди open‑source по качеству движения: вода, ветер, ткань, бег, физическая динамика — выглядит естественно.

Фотореалистичные персонажи

Сильна на статичных и медленных шотах с лицами. Photoreal‑оптимизация, не подходит под мультяшный стиль.

Другая задача? Напишите нам — подберём конфигурацию.

4 шага до запуска

Как арендовать сервер с Tesla A100

От регистрации до запуска — меньше 10 минут. Без звонков менеджеру и подписания договоров.

1

Соберите сервер

Выберите GPU, объем диска, операционную систему и тариф в конфигураторе.

2

Создайте аккаунт

Простая регистрация через Яндекс-ID, Т-Банк или электронную почту.

3

Пополните баланс

Картой или по счёту для юрлиц. Средства зачисляются мгновенно.

Запустите сервер

И он будет готов через пару минут. Подключайтесь по SSH, RDP или прямо в браузере.

Платите только за время

Остановите сервер в любой момент и неиспользованные деньги вернутся на баланс.

Скидки за долгий срок аренды

При аренде от 3-х месяцев вы получаете скидку от 5% до 25%.

Смена конфига на лету

Начните с CPU‑сервера, затем подключите GPU для тяжёлых задач.

Какую версию выбрать

Флагман

Mochi 1 Preview (bf16)

10BAsymmDiT · T2V

Эталонный релиз октября 2024. Полный fp32-чекпоинт ~40 ГБ. Single-GPU инференс — 1×H100 80GB. 480p (848×480), до 84 кадров @ 30 fps (~2.8 сек).

VRAM (bf16):
~60 ГБ
VRAM (4-bit):
~22 ГБ (bf16 на 1×GPU)

H100 80 ГБ / A100 80 ГБ

Mochi 1 FP8 (ComfyUI)

10BAsymmDiT · FP8

FP8-квантизация в едином checkpoint. Запуск на 24 ГБ VRAM, быстрее на GPU с FP8-операциями. Качество чуть ниже bf16.

VRAM (bf16):
~22 ГБ
VRAM (4-bit):
~18 ГБ

RTX 4090 48 ГБ / RTX 4090 24 ГБ

Mochi 1 (multi-GPU)

10BAsymmDiT · TP

Оригинальный repo поддерживает Context Parallel: модель шардируется между GPU. Подходит, если нет доступа к одной 80 ГБ карте.

VRAM (bf16):
~30 ГБ × 2
VRAM (4-bit):

2×A100 80 ГБ / 4×RTX 4090

Mochi 1 (Diffusers · low VRAM)

10BAsymmDiT · CPU offload

Diffusers + enable_model_cpu_offload + VAE tiling: латентные тензоры лежат на CPU, активный модуль — на GPU. Медленнее, но запускается на 12 ГБ.

VRAM (bf16):
~12-16 ГБ
VRAM (4-bit):
~10 ГБ

RTX 4090 24 ГБ / RTX 3090

4 способа запуска

Запустите одной командой

После создания сервера подключитесь по SSH и выберите подходящий инструмент.

Самый быстрый старт. Native-нода Mochi из коробки, FP8/bf16 единым checkpoint. Влезает в 24 ГБ VRAM. Готовый workflow — comfyanonymous/ComfyUI_examples/mochi.

# 1) ComfyUI (Ubuntu 24, CUDA 12.x):
git clone https://github.com/comfyanonymous/ComfyUI && cd ComfyUI
python3 -m venv venv && source venv/bin/activate
# Pre-install torch+cu128 (под driver 570.x)
pip install torch torchvision torchaudio \
  --index-url https://download.pytorch.org/whl/cu128
pip install -r requirements.txt

# 2) Веса (FP8, ~10 ГБ — fit в RTX 4090 24GB):
wget -P models/checkpoints \
  https://huggingface.co/Comfy-Org/mochi_preview_repackaged/resolve/main/split_files/diffusion_models/mochi_preview_fp8_scaled.safetensors

# 3) Запуск (из корня ComfyUI):
python3 main.py --listen 0.0.0.0 --port 8188
# Откройте workflow из ComfyUI_examples/mochi
Запустить Mochi 1

~168 ₽/час · посекундная оплата

Выберите конфигурацию сервера

Укажите параметры и запустите сервер за несколько минут

Тестовый запуск

Тестовый период
для бизнеса

Мы уверены в железе — поэтому даём потестировать до покупки.
Подключитесь по ЭДО, напишите нам, и мы обсудим условия тестового запуска.

Как получить:

  • 1 Подключитесь к нам по ЭДО
  • 2 Напишите нам
  • 3 Получите сервер с Tesla A100

Данные для подключения по ЭДО:

Оператор: АО «Калуга Астрал»

ID: 2AEE383BDF8-E70C-4F74-9E7E-995E8AC21999

Написать нам

Почему арендуют у нас

Серверы работают , мы следим

Мониторинг оборудования 24/7. Неисправный компонент заменим по гарантии без доплат.

Платите только за вычисления

Посекундная тарификация. Выключили сервер — счётчик остановился, данные на диске сохраняются. Скидки до 25% при оплате за 12 месяцев.

Поддержка, а не тикет-система

Сразу инженер, который разбирается в CUDA, PyTorch и настройке GPU-серверов. Ответ — до 15 минут.

Вопросы и ответы

Mochi 1 — открытая text‑to‑video модель Genmo на 10B параметров (архитектура AsymmDiT). Генерирует клипы 480p (848×480) × 30 fps по тексту, до 84 кадров (~2.8 секунды) за один проход. Главное преимущество — лучшее качество движения среди open‑source: вода, ветер, ткань, физика выглядят естественно. Слабее на анимации и cartoon‑стиле (оптимизирована под фотореализм).

Да. Веса релизнуты под Apache 2.0 — это разрешает коммерческое использование, модификацию, распространение, встраивание в продукт и продажу результатов генерации без роялти. Одна из самых либеральных лицензий среди видеомоделей (для сравнения, ранние версии HunyuanVideo шли с дополнительными ограничениями).

Базовая bf16‑конфигурация — H100 80 ГБ или A100 80 ГБ (single‑GPU инференс). В ComfyUI с FP8‑квантизацией — RTX 4090 48 ГБ или 4090 24 ГБ. Через Diffusers с CPU‑offload и VAE tiling — даже 12 ГБ (но медленнее в 2‑3 раза). Multi‑GPU режим (Context Parallel) делит модель между двумя картами.

bf16 (~60 ГБ загруженных весов) — эталонное качество, нужно H100/A100 80 ГБ. FP8 (~10 ГБ checkpoint) — заметно быстрее на GPU с FP8‑ядрами (Hopper, Ada Lovelace), помещается в 24 ГБ. Качество чуть ниже, но в большинстве случаев визуально неотличимо. Для продакшна на массовых картах рекомендуем FP8.

На 1×H100 80 ГБ — ~3‑6 минут на клип 480p / 30 fps / 84 кадра (64‑128 шагов диффузии). На RTX 4090 24 ГБ с FP8 — ~5‑10 минут. В Diffusers с CPU‑offload — может вырастать до 15‑20 минут. Латентные тензоры большие, поэтому VAE‑декодирование занимает заметную долю времени.

Релизный preview работает в 848×480 (480p) при 30 fps, до 84 кадров (~2.8 секунды). Genmo анонсировала Mochi 1 HD (720p) в roadmap, но публичных весов пока нет. Для более длинных клипов используют чейн‑генерацию: последний кадр клипа — первый кадр следующего.

Mochi 1 — лучшее движение и физика, фотореализм, T2V, Apache 2.0. HunyuanVideo (13B) — лучшая temporal consistency и работа с лицами, клипы длиннее (129 кадров @ 720p). CogVideoX — топ для image‑to‑video и LoRA‑экосистемы. Wan 2.1 (14B) — лучшее общее качество в 2025‑26, но требует больше VRAM. Для motion‑driven сцен берите Mochi, для длинных клипов с людьми — HunyuanVideo.

Сервер готов за 3‑5 минут после оплаты. Дальше — установка ComfyUI или Diffusers (~3 минуты), скачивание весов с HuggingFace (40 ГБ для bf16 или 10 ГБ для FP8 — 1‑5 минут на гигабитном канале). Итого 10‑15 минут до первого видео. Инструкция по SSH — тут.

Нет. Мы запускаем open‑weight веса локально на серверах в РФ (Самарская обл.). Mochi 1 не отправляет данные наружу — это полностью оффлайн модель после загрузки. Если нужен изолированный VPC‑контур — поддержка настроит.

Да. Сообщество уже выпускает Mochi LoRA‑адаптеры на CivitAI. Полный файнтюн 10B‑модели требует 4‑8×H100 на 1‑3 дня. LoRA на стиль или персонажа реальна на 1×H100 80 ГБ за 6‑24 часа. Apache 2.0 разрешает выпускать собственные дообученные версии и продавать их.

Да. Работаем с ООО/ИП по договору, оплата по счёту, НДС, ЭДО через Диадок/СБИС. Для тестового периода для бизнеса оператор и ID для ЭДО — в форме на странице.

Mochi 1 на вашем GPU
От 168 ₽/час, посекундная оплата.

Оплата в рублях, посекундно. Поддержка 24/7. Запуск за 5 минут.