Гайды

55

30 мая 2026

Сколько стоит запустить FLUX.1: обзор цен на генерацию изображений

FLUX.1 от Black Forest Labs — одна из лучших open-weight моделей text-to-image. Разбираем, во сколько обходится её запуск: через API, в аренду GPU и на своей карте — с реальными цифрами и расчётом стоимости одной картинки.

FLUX.1 от Black Forest Labs — семейство open-weight моделей text-to-image, которое в 2024–2026 годах стало стандартом де-факто для качественной генерации изображений с открытыми весами. По детализации, анатомии рук и читаемому тексту на картинке FLUX.1 догнал, а местами обошёл закрытые Midjourney и проприетарные сборки Stable Diffusion. Главный вопрос на практике — не «какая модель лучше», а «сколько это стоит запустить». В этом обзоре разбираем все варианты и считаем стоимость одной картинки.

Про цены в статье. Здесь и далее упоминаются ориентировочные цены API, подписок и аренды GPU по состоянию на май 2026, курс доллара ≈ 79 ₽. Перед покупкой/арендой сверьтесь с актуальными тарифами на сайтах сервисов и провайдеров. Цены Интелион Облако — на странице тарифов.

Версии FLUX.1: schnell, dev, pro

От версии напрямую зависит и качество, и цена запуска:

Версия Лицензия Шагов Скорость Когда брать
FLUX.1 [schnell] Apache 2.0 (коммерч. ОК) 4 Очень быстро Продакшн, API, массовая генерация
FLUX.1 [dev] Non-Commercial 20–50 Средне Максимальное качество, исследования
FLUX.1 [pro] Только API BFL Через облако, без весов

Для сервисов и интеграций берут schnell — он дистиллирован под 4 шага без guidance, генерирует картинку за секунды и разрешён для коммерции. Именно schnell мы запускаем в нашем AI API.

Какой GPU нужен для FLUX.1

FLUX.1 — это трансформер на ~12 млрд параметров. В bf16 веса занимают ~24 ГБ, поэтому ключевой порог — 24 ГБ видеопамяти:

GPU VRAM FLUX.1 Комментарий
RTX 3090 / 4090 24 ГБ ✅ Целиком Топ цена/производительность для self-host
NVIDIA A10 / A5000 24 ГБ ✅ Целиком Дата-центрная, экономична по энергии
RTX 3060 / 4060 Ti 16 ГБ 16 ГБ ⚠️ С offload/fp8 Медленнее, нужна квантизация
RTX 3060 12 ГБ 12 ГБ ⚠️ Только fp8/GGUF Заметно медленнее

24 ГБ «с запасом хватает для большинства diffusion-задач» — это подтверждают и площадки аренды, и наш опыт: FLUX.1-schnell стабильно работает на A10 и 4090 с CPU-offload. На картах 12–16 ГБ FLUX тоже запускается, но через fp8/GGUF-квантизацию и заметно медленнее.

Вариант 1. Через API — платите за результат

Самый простой путь: не поднимать ничего, просто дёргать HTTP-эндпоинт. Здесь вы платите либо за картинку, либо за секунды работы GPU — и не платите за простой.

Сервис Цена Оплата Нюанс
Replicate (schnell) ~$0.003 / картинку $ / зарубежная карта Оплата из РФ затруднена
fal.ai, Together сопоставимо $ / зарубежная карта То же
Интелион AI API (schnell) ₽0.02 / сек GPU (вкл. НДС) ₽, российский счёт Платите только за секунды генерации

Наш AI API в регионе «Россия» тарифицирует FLUX.1-schnell по секундам реального времени работы GPU (job_end − job_start), без оплаты простоя, очереди и сетевых задержек. Типичная картинка 512–1024 px генерируется за единицы секунд, то есть выходит несколько копеек за изображение. Запросы — в OpenAI-совместимом формате POST /v1/images/generations, данные не покидают РФ, оплата в рублях с НДС, без зарубежных карт.

Вариант 2. Аренда GPU — для постоянного потока

Если вы генерируете тысячами в день, выгоднее арендовать целую карту и крутить её под завязку. Здесь вы платите за час владения GPU — независимо от загрузки.

GPU Интелион Облако Зарубежные споты (медиана)
NVIDIA A10 24 ГБ ₽26.79 / час (≈ ₽18 000/мес) ~$0.30–0.40 / час
RTX 4090 24 ГБ ₽81.85 / час (≈ ₽55 000/мес) ~$0.40 / час

A10 24 ГБ в Интелион Облако обходится ≈ ₽26.79/час — это около $0.34/час, то есть дешевле, чем медианная аренда RTX 4090 на зарубежных спот-площадках ($0.40/час), при тех же 24 ГБ, которых FLUX.1 хватает. Плюс — оплата в рублях, размещение в РФ и иммерсионное охлаждение (ниже энергозатраты). Важный момент про спот-аренду за рубежом: там вы платите за всю карту почасово, включая простой между генерациями и время на настройку окружения, а оплата идёт в валюте.

Вариант 3. Своя карта — когда окупается

Если FLUX крутится у вас 24/7 месяцами, своя RTX 4090/3090 или A10 окупается. Грубый ориентир: при цене карты ~₽180 000 (4090) и аренде ₽55 000/мес точка окупаемости — около 3–4 месяцев непрерывной работы, без учёта электричества, охлаждения и амортизации. Для разовых экспериментов это невыгодно — проще почасовая аренда или API.

Сколько стоит одна картинка: сценарии

Сведём всё к цене за изображение (FLUX.1-schnell, ~5 секунд на генерацию):

Сценарий Как платите Цена за картинку
Спорадика / интеграция в продукт API, ₽0.02/сек ≈ ₽0.10 (только за генерацию)
Постоянный батч на арендованной A10 ₽26.79/час при ~100% загрузке ≈ ₽0.04–0.05
Зарубежный API (Replicate) $0.003/картинку ≈ ₽0.24 + проблемы с оплатой
Простой картой почасово платите за час, генерите 1 картинку дорого (час за одно изображение)

Вывод по экономике простой: для нерегулярной нагрузки API дешевле в разы — вы не платите за простаивающую карту. Для непрерывного батча дешевле аренда или своя карта — там цена за картинку минимальна, потому что GPU загружен на 100%.

Что в итоге выбрать

  • Интеграция в приложение, бот, нерегулярные запросы → API. Наш AI API rus: ₽0.02/сек, оплата в ₽, без зарубежных карт, данные в РФ.
  • Тысячи картинок в день, постоянный поток → аренда GPU. A10 24 ГБ за ₽26.79/час — дешевле зарубежного 4090, 24 ГБ хватает.
  • Долгий продакшн 24/7 → своя карта 24 ГБ, окупается за 3–4 месяца.
  • Разовые эксперименты → почасовая аренда или несколько вызовов API.

Запустить FLUX.1-schnell можно прямо сейчас: через AI API в регионе «Россия» (платите за секунды) или арендовать GPU под self-host. Цены на оба варианта — на странице тарифов.

Часто задаваемые вопросы

Сколько стоит одна картинка в FLUX.1?

Через наш AI API — несколько копеек: FLUX.1-schnell тарифицируется ₽0.02 за секунду GPU (с НДС), а одна картинка генерируется за единицы секунд (≈ ₽0.10). На арендованной карте при полной загрузке выходит ещё дешевле — около ₽0.04–0.05 за изображение.

Какой GPU нужен для FLUX.1?

Оптимально — видеокарта с 24 ГБ памяти: RTX 3090, RTX 4090 или дата-центрная A10/A5000. FLUX.1 (12 млрд параметров) в bf16 занимает около 24 ГБ. На картах 12–16 ГБ модель тоже запускается, но через fp8/GGUF-квантизацию и заметно медленнее.

Можно ли запустить FLUX.1 локально на своей карте?

Да, веса FLUX.1 [schnell] (Apache 2.0) и [dev] открыты. На своей RTX 4090/3090 или A10 24 ГБ модель работает целиком. Для постоянной нагрузки 24/7 это окупается за 3–4 месяца относительно аренды; для разовых задач выгоднее почасовая аренда или API.

Что дешевле — свой GPU или API?

Зависит от загрузки. Для нерегулярных запросов дешевле API: вы платите только за секунды генерации и не оплачиваете простой карты. Для непрерывного потока тысяч картинок в день дешевле аренда или своя карта — там GPU загружен на 100% и цена за картинку минимальна.

Чем FLUX.1-schnell отличается от dev?

schnell дистиллирован под 4 шага без guidance — генерирует за секунды и разрешён для коммерции (Apache 2.0). dev даёт чуть выше качество, но требует 20–50 шагов и имеет некоммерческую лицензию. Для API и массовой генерации берут schnell.

Можно ли оплачивать генерацию FLUX.1 из России?

Да. Зарубежные API (Replicate, fal.ai) требуют иностранную карту, что из РФ затруднено. Наш AI API в регионе «Россия» тарифицируется в рублях с НДС, оплачивается с российского счёта, а данные не покидают РФ.

Гайды

#A10

#Stable Diffusion

#генерация изображений

#RTX 4090

#AI API

#FLUX.1

#FLUX schnell

#text-to-image

#Black Forest Labs

#аренда GPU

#Midjourney

#цены