Сложный reasoning и логика
Главная фича R1: reinforcement learning над цепочкой мыслей. GPQA Diamond 81% (R1‑0528), AIME 2025 87.5%. Сравнимо с OpenAI o3.
Главная фича R1: reinforcement learning над цепочкой мыслей. GPQA Diamond 81% (R1‑0528), AIME 2025 87.5%. Сравнимо с OpenAI o3.
MATH‑500 97.3% у флагмана, 94% у distill 32B. Олимпиадная математика, доказательства, физические модели — модель сама расписывает шаги.
SWE‑Bench Verified 57.6%, LiveCodeBench 73.3%, Codeforces rating 1930. Aider Polyglot 71.6% — для bug‑fixing и refactoring в больших репозиториях.
Другая задача? Напишите нам — подберём конфигурацию.
Флагман. Reasoning уровня OpenAI o3 — AIME 2025 87.5%, GPQA 81%, SWE‑Verified 57.6%. Контекст 128K.
8× H200 141 ГБ (bf16) / 8× A100 80 ГБ (Q4)
Лучший distill: AIME 70%, MATH‑500 94.5%, GPQA 65.2%. Базируется на Llama 3.3 70B Instruct.
2× A100 80 ГБ (bf16) / A100 80 ГБ (Q4)
Sweet spot: обходит OpenAI o1‑mini, AIME 72.6%, MATH‑500 94.3%, GPQA 62.1%. Контекст 128K.
A100 80 ГБ (bf16) / RTX 4090 48 ГБ (Q4)
Баланс цены и качества: AIME 69.7%, MATH‑500 93.9%, GPQA 59.1%. База — Qwen2.5‑14B.
RTX 4090 48 ГБ (bf16) / RTX 3090 24 ГБ (Q4)
Свежий distill из R1‑0528 на Qwen3‑8B base: AIME 2024 86%, GPQA 61.1%. Сопоставим с Qwen3‑235B Thinking.
RTX 3090 / A10 24 ГБ (bf16)
Лёгкий старт: AIME 55.5%, MATH‑500 92.8%. Базируется на Qwen2.5‑Math‑7B — силён в математике.
RTX 3090 / A10 24 ГБ
Distill на Llama 3.1‑8B: AIME 50.4%, MATH‑500 89.1%. Подходит под англоязычный чат и tool‑use.
RTX 3090 / A10 24 ГБ
Самая лёгкая reasoning‑модель: AIME 28.9%, MATH‑500 83.9%. Для on‑device, edge, прототипов.
Любая GPU 8 ГБ+
Укажите параметры и запустите сервер за несколько минут
Мы уверены в железе — поэтому даём потестировать до покупки.
Подключитесь по ЭДО, напишите нам, и мы обсудим условия тестового запуска.
Как получить:
Данные для подключения по ЭДО:
Оператор: АО «Калуга Астрал»
ID: 2AEE383BDF8-E70C-4F74-9E7E-995E8AC21999
Мониторинг оборудования 24/7. Неисправный компонент заменим по гарантии без доплат.
Посекундная тарификация. Выключили сервер — счётчик остановился, данные на диске сохраняются. Скидки до 25% при оплате за 12 месяцев.
Сразу инженер, который разбирается в CUDA, PyTorch и настройке GPU-серверов. Ответ — до 15 минут.
Оплата в рублях, посекундно. Поддержка 24/7. Запуск за 5 минут.