Чат-ассистент и инструкции
Wildbench v2 вырос с 55.6% до 65.33%. Заметно меньше повторов и зацикливаний на длинных диалогах. Идеален под замену ChatGPT в контуре.
Wildbench v2 вырос с 55.6% до 65.33%. Заметно меньше повторов и зацикливаний на длинных диалогах. Идеален под замену ChatGPT в контуре.
Один из ключевых апгрейдов 3.2 — стабильный native tool-calling. Нативная поддержка parallel function calls, без галлюцинаций аргументов.
HumanEval+ вырос с 88.99% до 92.90%, MBPP Pass@5 — с 74.63% до 78.33%. Хорош для middleware-кода, ревью PR, рефакторинга.
Другая задача? Напишите нам — подберём конфигурацию.
Полные веса в bf16. Понимает текст и изображения нативно. Контекст 128K, function calling, JSON-mode. Apache 2.0.
A100 80 ГБ (bf16) / RTX 4090 48 ГБ (FP8/Q8)
Квантизация Q8_0 — практически без потерь качества. Идеальный баланс для одной RTX 4090 48 ГБ с большим контекстом.
RTX 4090 48 ГБ (с запасом под контекст и vision)
Q4_K_M — sweet-spot 4-bit. Влезает на любую 24 ГБ GPU с запасом под контекст. Минимальная просадка качества.
RTX 3090 / RTX 4090 24 ГБ / A10 (24 ГБ)
FP8/NVFP4-сборка от Red Hat AI. Нативная поддержка на Hopper (H100) и Ada Lovelace. Скорость как у Q4 при качестве bf16.
RTX 4090 48 ГБ / H100 80 ГБ (нативный FP8)
Укажите параметры и запустите сервер за несколько минут
Мы уверены в железе — поэтому даём потестировать до покупки.
Подключитесь по ЭДО, напишите нам, и мы обсудим условия тестового запуска.
Как получить:
Данные для подключения по ЭДО:
Оператор: АО «Калуга Астрал»
ID: 2AEE383BDF8-E70C-4F74-9E7E-995E8AC21999
Мониторинг оборудования 24/7. Неисправный компонент заменим по гарантии без доплат.
Посекундная тарификация. Выключили сервер — счётчик остановился, данные на диске сохраняются. Скидки до 25% при оплате за 12 месяцев.
Сразу инженер, который разбирается в CUDA, PyTorch и настройке GPU-серверов. Ответ — до 15 минут.
Оплата в рублях, посекундно. Поддержка 24/7. Запуск за 5 минут.