Из ТГ канала

🙂 Если вы еще не поучаствовали в нашем опросе, то самое время это сделать, пока новые модели не вытеснили DeepSeek-R-1 из инфополя.
🔣 А попытки, несомненно, предпринимаются: институт Ai2 из Сиэтла представил модель, которая, по словам разработчиков, легко обходит DeepSeek на поворотах.
🔣 Модель назвали Tulu 3 405B (если взлетит – станем ездить в Тулу со своей Tulu), 405 млрд параметров, 256 параллельно работающих графических процессоров для обучения.
*️⃣Она, традиционно, превосходит GPT-4o на некоторых бенчмарках, но пока есть только результаты внутренних тестирований.
*️⃣Имеет открытый исходный код в свободном доступе, и все разрешительные лицензии. По словам представителя компании – покруче, чем у некоторых представляет мощную альтернативу существующим большим моделям. Посмотрим! 😎
🙂 Artificial Intelion
Новости AI
#AI
#Ai2
#Tulu
Рекомендуем прочесть:
- Как посчитать VRAM для LLM: подробный гайд по расчету видеопамяти для моделей машинного обучения
- Tesla A100 40GB vs A100 80GB: Как выбрать GPU для ИИ, LLM и Data Science
- Что такое GPU сервер и как его арендовать?
- Tesla A10 vs RTX 3090 — оптимальный выбор GPU для ваших нейросетей
- Зачем вам нужна Tesla A100 80 ГБ — и почему в «Интелион Облако» она раскрывается на максимум