Из ТГ канала

⚡️ Если вы еще не определились, за кого болеть в битве R1 VS o1, то вот основные факты.
🙂 Китайские товарищи из компании DeepSeek выпустили свою «самую умную рассуждающую модель» DeepSeek-R1.
🔣 И да, в некоторых бенчмарках она не хуже, а то и лучше о1 от OpenAI. Разумеется, не по всем и в довольно узком спектре задач – а все-таки. Если конкретно - в тестах AIME, MATH-500 и SWE-bench Verified.
🔣 Модель хорошо программирует, бодро рассуждает, практикует активный фактчекинг и содержит более 670 млрд параметров. Облегченные версии на подходе, они смогут работать на нотубуках, например.
🔣 Полновесная R1 требует более серьезной вычислительной мощи, но за этим вы всегда можете обратиться к нам. А еще заявлено, что модель «придерживается социалистических ценностей». Так что за работу, товарищи!
*️⃣Интересно, что многие компании грозились выпускать больше маленьких и легких моделей, а в результате выпускают думающих гигантов.
Да, пробовать можно бесплатно (50 запросов в сутки).
🙂 Artificial Intelion
Новости AI
#AI
#DeepSeek
#DeepSeekR1
Рекомендуем прочесть:
- Как посчитать VRAM для LLM: подробный гайд по расчету видеопамяти для моделей машинного обучения
- Tesla A100 40GB vs A100 80GB: Как выбрать GPU для ИИ, LLM и Data Science
- Что такое GPU сервер и как его арендовать?
- Tesla A10 vs RTX 3090 — оптимальный выбор GPU для ваших нейросетей
- Зачем вам нужна Tesla A100 80 ГБ — и почему в «Интелион Облако» она раскрывается на максимум