Agentic engineering
GLM-5 спроектирован под автономных агентов: tool-use, planning, multi-step reasoning. SWE-bench 77.8% — выше Claude Sonnet 4 и DeepSeek V3.2.
GLM-5 спроектирован под автономных агентов: tool-use, planning, multi-step reasoning. SWE-bench 77.8% — выше Claude Sonnet 4 и DeepSeek V3.2.
GLM-5.1 на SWE-bench Pro 58.4 — #1 среди open-weight моделей (выше GPT-5.4, Claude Opus 4.6, Gemini 3.1 Pro). Контекст 200K.
GLM Chatbot Arena #1 (1451). MIT-лицензия — встраивай в свой продукт без royalty. Self-host в РФ закрывает требования по 152-ФЗ.
Другая задача? Напишите нам — подберём конфигурацию.
Самый практичный GLM для single-node. 12B активных весов дают скорость dense‑12B при качестве 100B+.
2× A100 80 ГБ (bf16) / RTX 4090 48 ГБ + 80 ГБ RAM (Q4)
Мультимодальный вариант на базе Air. SOTA на 42 vision-бенчмарках, 64K multimodal context, 3D-RoPE.
2× A100 80 ГБ / RTX 4090 48 ГБ (Q4)
Предыдущий флагман (релиз 30 сентября 2025). 200K context, near-parity с Claude Sonnet 4 на CC-Bench, на 15% меньше токенов чем GLM-4.5.
8× H100 80 ГБ (bf16) / 4× A100 80 ГБ (AWQ Q4)
Vision-вариант на базе Air (есть также 9B Flash). 128K мультимодального контекста, нативный function calling, document understanding.
2× A100 80 ГБ / RTX 4090 48 ГБ (Q4)
Флагман фев 2026. SWE-bench 77.8%, GPQA Diamond 86%, Chatbot Arena #1. Обучен на 28.5T токенов на Huawei Ascend.
8× H200 141 ГБ (bf16) / 8× H100 80 ГБ (FP8) / 1× H200 + RAM (1-bit dynamic GGUF)
Обновление 7 апреля 2026: SWE-bench Pro 58.4 — выше GPT-5.4 (57.7) и Claude Opus 4.6 (57.3). До 8 часов автономной работы над одной задачей.
8× H200 (bf16) / 8× H100 (FP8)
Укажите параметры и запустите сервер за несколько минут
Мы уверены в железе — поэтому даём потестировать до покупки.
Подключитесь по ЭДО, напишите нам, и мы обсудим условия тестового запуска.
Как получить:
Данные для подключения по ЭДО:
Оператор: АО «Калуга Астрал»
ID: 2AEE383BDF8-E70C-4F74-9E7E-995E8AC21999
Мониторинг оборудования 24/7. Неисправный компонент заменим по гарантии без доплат.
Посекундная тарификация. Выключили сервер — счётчик остановился, данные на диске сохраняются. Скидки до 25% при оплате за 12 месяцев.
Сразу инженер, который разбирается в CUDA, PyTorch и настройке GPU-серверов. Ответ — до 15 минут.
Оплата в рублях, посекундно. Поддержка 24/7. Запуск за 5 минут.