Перейти к содержимому
OpenAI-совместимый API · Оплата в рублях

AI API: запускайте
LLM через один запрос

Inference API для больших языковых моделей — Claude, DeepSeek, Qwen и другие. Поменяйте base_url и ключ, платите в рублях с единого баланса личного кабинета.

Бесплатный лимит на старте — попробуйте без привязки карты

OpenAI-совместимый API
Стандарт отрасли и ИИ-агентов
Anthropic-совместимый API
Claude Code «из коробки»
Расчёты в рублях
Биллинг, НДС и закрывающие документы для юрлиц
Есть модели в РФ
Часть моделей работает только в России — данные не покидают страну

Что это такое

Inference API, а не ещё один сервер

AI API — это Inference-платформа Интелион Облако: вы обращаетесь к готовым моделям по HTTP и платите за токены, без аренды и настройки GPU. Endpoint OpenAI-совместимый, поэтому существующий код на OpenAI SDK, LangChain или curl переключается одной строкой.

  • Стриминг (SSE), temperature, max_tokens, tool calling
  • Единый ключ и баланс с личным кабинетом — отдельный кошелёк не нужен
  • Отчёт по токенам в каждом ответе
curl https://int.aiapi.intelion.cloud/v1/chat/completions \
  -H "Authorization: Bearer $INTELION_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "deepseek-v3-2",
    "messages": [{"role": "user", "content": "Привет!"}]
  }'

base_url зависит от региона: International — int.aiapi.intelion.cloud, Россия — rus.aiapi.intelion.cloud. Ключ действует в своём регионе.

Почему мы

Условия, которых нет у агрегаторов

Не «ещё 300 моделей в списке», а понятный и легальный доступ к лучшим из них

Переходите с OpenRouter? Аналог OpenRouter с оплатой в рублях →

OpenAI-совместимость

Тот же формат запросов и ответов. Миграция с OpenAI SDK, LangChain, LlamaIndex — замена base_url и ключа.

Оплата в рублях, с документами

Тарифы в рублях, НДС 22%. Для юрлиц — закрывающие документы (УПД). Без зарубежных карт и VPN.

Claude — легально

Вся линейка Anthropic: Claude Sonnet и Opus 4.6 с окном 1M токенов, Haiku — по прямому корпоративному договору, в рублях и с документами. Не серые ключи.

Локальный контур в РФ

Есть модель на GPU в дата-центре на территории России — данные не покидают страну. Важно для 152-ФЗ.

Единый баланс с ЛК

Тот же кошелёк, что и для GPU-серверов. Один счёт на инфраструктуру и инференс, одна точка управления ключами.

Курированный каталог

По одному сильному кандидату на каждый класс задач: reasoning, код, зрение, флагман — без «длинного хвоста» бесполезных моделей.

Каталог

Доступные модели

Цены за 1 000 000 токенов. Тарифы публикуются без НДС; НДС 22% начисляется сверх.

МодельКонтекстInput, ₽ / 1MOutput, ₽ / 1M
Claude Sonnet 4.5 code1M ctx225.301126.49
Claude Sonnet 4.6 code1M ctx225.301126.49
Mistral Devstral 2 123B code262K ctx30.04150.20
Qwen3 Coder 30B code262K ctx16.3963.11
Qwen3 Coder 480B code262K ctx16.53135.18
Claude Haiku 4.5 general200K ctx75.10375.50
GLM 4.7 general131K ctx45.06165.22
Llama 3.3 70B Instruct general131K ctx57.4957.49
NVIDIA Nemotron Super 120B general131K ctx11.2748.82
Qwen3 32B general131K ctx16.3963.11
Claude Opus 4.5 reasoning200K ctx375.501877.48
Claude Opus 4.6 reasoning1M ctx375.501877.48
DeepSeek R1 reasoning131K ctx107.78431.12
DeepSeek V3.2 reasoning163K ctx46.57138.94
GPT-OSS 120B reasoning131K ctx11.2745.06
GPT-OSS 20B reasoning131K ctx7.3831.97
Kimi K2 Thinking reasoning262K ctx45.06187.75
MiniMax M2.5 reasoning200K ctx22.5390.12
Qwen3 235B A22B reasoning262K ctx22.9593.44
Qwen3-VL 235B vision262K ctx39.81199.77
Parakeet TDT 0.6B v3 (RU, распознавание речи) asr0.000.00
Devstral Small 24B (RU, DevOps-агент) code65K ctx8.2024.59
T-pro 2.1 (RU, локально) general32K ctx8.2024.59
FLUX.1-schnell (RU, генерация изображений) image0.000.00

Полный прайс и условия — на странице Цены.

Быстрый старт

Три шага до первого ответа

Получите ключ

Создайте API-ключ в личном кабинете Интелион Облако

Укажите base_url

Подставьте наш endpoint и ключ в любой OpenAI-совместимый клиент

Отправляйте запросы

Платите за токены с единого баланса — без минималок и абонплаты

Claude Code

Claude Code — на всю команду, за счёт юрлица

У нас не только OpenAI-совместимый, но и Anthropic-совместимый API — тот самый, на котором работает Claude Code. Задаёте две переменные окружения — и Claude Code ходит через «Интелион».

  • Раздайте Claude Code всей команде с одного баланса
  • Оплата в рублях, закрывающие документы (УПД) для юрлица
  • Без зарубежных карт и личных подписок у каждого разработчика

Подробная инструкция и ответы на вопросы — Claude Code в России.

export ANTHROPIC_BASE_URL=https://int.aiapi.intelion.cloud/anthropic
export ANTHROPIC_AUTH_TOKEN=ic-ВАШ_КЛЮЧ
export ANTHROPIC_MODEL=claude-sonnet-4-6

claude  # теперь Claude Code работает через «Интелион»

Сценарии

Для чего используют

Чат-боты и ассистенты

Поддержка, внутренние ассистенты, RAG поверх своих данных.

Код и агенты

Генерация и ревью кода, agentic-сценарии в IDE на Qwen3 Coder и Devstral.

Обработка документов

Распознавание скриншотов, схем и документов мультимодальной Qwen3-VL.

Массовая обработка

Классификация, экстракция и суммаризация на дешёвых моделях вроде Nemotron.

Вопросы и ответы

Часто спрашивают

Это OpenAI-совместимый Inference API: достаточно поменять base_url и ключ. Дальше — оплата в рублях с закрывающими документами, без зарубежных карт и VPN, и модель, работающая локально в РФ.

Курированный каталог топовых моделей: Claude (Sonnet и Opus 4.6), DeepSeek, Qwen3, Kimi, GLM, GPT-OSS, Nemotron и другие. Актуальный список с ценами — в разделе «Доступные модели» и в личном кабинете.

Оплата с единого баланса личного кабинета — того же, с которого арендуют GPU-серверы. Тарифы в рублях, НДС 22%. Для юрлиц — закрывающие документы (УПД).

Есть локальный регион: как минимум одна модель работает на железе в дата-центре на территории РФ, и данные по ней не покидают страну.

Да. Endpoint реализует OpenAI-совместимый /v1/chat/completions со стримингом и tool calling. Подойдёт любой клиент, умеющий менять base_url: OpenAI SDK, LangChain, LlamaIndex, curl.

Начните с бесплатного лимита

API-ключ, единый рублёвый баланс и закрывающие документы — всё в личном кабинете.

Создать аккаунт