Из ТГ канала

🤪 Все настолько сильно зарегистрировались в DeepSeek-R1, что в какой-то момент она просто перестала реагировать, а разработчики выкатили грозное сообщение с красной полосочкой, возвещающее о наличии проблем. И новых пользователей на какое-то время просто перестали регистрировать.
Впрочем, компания сама виновата: нечего было так громко вкатываться на рынок 😉
Но мы все равно не скучаем без новых китайских разработок: Alibaba выпустила многообещающее обновление семейства моделей Qwen: Qwen2.5-VL.
Что может новая модель?
*️⃣Качественно распознает текст, анализирует документы, бодро обрабатывает разные языки, узнает рукописный текст, таблицы, диаграммы, химически формулы и даже ноты.
*️⃣ Умеет в пространственное мышление с использованием абсолютных координат и форматов JSON.
*️⃣ Обрабатывает длинные видео, сможет посмотреть за вас сезон сериала / спортивного кубка и собрать трейлер из ключевых фрагментов.
*️⃣ Работает за вас в браузере (делает все то же, что Operator от OpenAI, только быстрее).
А про обучение…
Новости AI
Рекомендуем прочесть:
- Как посчитать VRAM для LLM: подробный гайд по расчету видеопамяти для моделей машинного обучения
- Tesla A100 40GB vs A100 80GB: Как выбрать GPU для ИИ, LLM и Data Science
- Что такое GPU сервер и как его арендовать?
- Tesla A10 vs RTX 3090 — оптимальный выбор GPU для ваших нейросетей
- Зачем вам нужна Tesla A100 80 ГБ — и почему в «Интелион Облако» она раскрывается на максимум