
Давным давно...
🤪 Все настолько сильно зарегистрировались в DeepSeek-R1, что в какой-то момент она просто перестала реагировать, а разработчики выкатили грозное сообщение с красной полосочкой, возвещающее о наличии проблем. И новых пользователей на какое-то время просто перестали регистрировать. Впрочем, компания сама виновата: нечего было так громко вкатываться на рынок 😉 Но мы все равно не скучаем без новых китайских разработок: Alibaba выпустила многообещающее обновление семейства моделей Qwen: Qwen2.5-VL. Что может новая модель? *️⃣Качественно распознает текст, анализирует документы, бодро обрабатывает разные языки, узнает рукописный текст, таблицы, диаграммы, химически формулы и даже ноты. *️⃣ Умеет в пространственное мышление с использованием абсолютных координат и форматов JSON. *️⃣ Обрабатывает длинные видео, сможет посмотреть за вас сезон сериала / спортивного кубка и собрать трейлер из ключевых фрагментов. *️⃣ Работает за вас в браузере (делает все то же, что Operator от OpenAI, только быстрее). А про обучение…

Давным давно...
🙂 В ближайшее время DeepSeek явно не собирается покидать информационное пространство, так что придется следить за этими новыми звездами. DeepSeek – «сигма-бой» этой недели, если вы понимаете, о чем мы 😎 И пока все продолжают удивляться возможностям R1, у них уже готов новый анонс. 🔣 Компания выпустила набор моделей Janus Pro – LLM с 1B параметров, мультимодальностью и сверхспособностями. *️⃣ Обещают, что будет работать в браузере (правда, пока только в Хроме), и не просто работать, а выполняться на 100% локально, благодаря Transformers.js и Runtime Web, без отправки данных на сервер. *️⃣ Janus Pro умеет анализировать загруженные изображения, конвертировать их в код, формулы, мемы или другие изображения. В наборе есть модели разной мощности, чем выше число параметров – тем круче результат. Ограничение по разрешению для изображений на входе - 384 x 384, на выходе выше. *️⃣ Разумеется, модель круче многих существующих – даже таких серьезных как Stable Diffusion XL и DALL-E 3, не говоря уже о моделях поменьше. *️⃣ Отдельный повод для гордости – LLM обучена на базе оригинальных моделей DeepSeek-LLM-1.5b-base и DeepSeek-LLM-7b-base, так что, как говорится, все свое. Код и параметры на Hugging Face. #AI #DeepSeek #JanusPro 🙂 Artificial Intelion
Читайте в Telegram
В нашем канале мы анализируем и тестируем LLMs, следим за трендами и рассказываем, как AI меняет мир.

Давным давно...
🙂 Пока DeepSeek роняет акции NVIDIA, расширяет штат сотрудников и смущает умы, побеждая o1 в тестах то тут, то там, мы попросили нашего DS-разработчика Михаила оценить личный опыт использования R1. 🔣 И вот, что он ответил: На примерах AIME и MATH DeepSeek-R1 показывает одинаковые результаты с o1, т.е. хорошо решает текстовые и математические задачи. Однако, в тестах, где играют в крестики-нолики, обе модели делают ошибки. По мощности с o1 и R1 можно еще сравнить модели Qwen QvQ-72B и QwQ-32B, но по бенчмаркам они достаточно сильно отстают. Модели уровня DeepSeek-R1 и OpenAI o1 требуют значительных вычислительных ресурсов для обучения и развертывания. Для их эффективной работы необходимы мощные серверы с высокопроизводительными графическими процессорами. Компании, разрабатывающие такие модели, часто инвестируют значительные средства в серверные кластеры. Пользователям полномасштабных версий R1 также потребуются мощные серверы с графическими процессорами. *️⃣(Хорошо, что сейчас их можно легко арендовать). По мере роста популярности и использования крупных языковых моделей спрос на вычислительные мощности будет только расти. #AI #DeepSeek #R1 #IntelionCloud 🙂 Artificial Intelion

Давным давно...
⚡️ Operator от OpenAI уже здесь! Не успели мы пожаловаться, что выпуск ИИ-агента задерживается, как вышел релиз! Новостей и мнений много, выбрали для вас главное. 🔣 Operator – первый ИИ-агент от OpenAI. Он умеет выходить в Интернет и делать все то же, что и вы: ориентироваться в поиске, открывать сайты, заказывать отели, билеты и столики (предупреждение: в соцсетях активизировалась группа разгневанных фанатов, которые везде пишут, что это «не инструмент букинга, а великое достижение ИИ-прогресса!!!»). 🔣 Используя свой собственный браузер, Operator может просматривать веб-страницы и работать с ними: вводить текст, щелкать мышью, прокручивать. Дальше вы даете ему задания, и он их выполняет: заполняет документы, заказывает еду (помним: не инструмент букинга!!! 😊), генерит мемы. 🔣 В основе – новая модель Computer-Using Agent (CUA), по сути - GPT-4o с расширенными возможностями, которая умеет «видеть» страницы и взаимодействовать с графическими интерфейсами — кнопками, меню и текстовыми полями на экране. *️⃣ Если что-то пойдет не так, Operator должен зафиксировать ошибку и позвать человека — хотя как его теперь дозовешься) #AI #OpenAI #Operator 🙂 Artificial Intelion

Давным давно...
🙂 Новые модели появляются практически каждый день, но и проверенных временем друзьях забывать не стоит – иначе кто за вас код писать станет? 🔣 У ChatGPT скоро появится коллега – его зовут Operator, и это тот самый ИИ-агент от OpenAI для запуска в браузере. В ChatGPT уже встроили кнопку для перехода на боковой панели, но пока она не работает. *️⃣Если не терпится попробовать, можно обновиться до ChatGPT Pro, там Operator заработает раньше всего. Вообще-то уже должен, но еще нет. *️⃣Запуск несколько раз откладывали, боясь, что хитрые пользователи будут обходить защиту и провоцировать наивный ИИ на плохие слова и поступки, а чем сложнее агент – тем проще его запутать. *️⃣Обещают, что Operator станет неоценимым помощником, возьмет на себя автоматизацию всех процессов в браузере и вообще поразит нас невиданными способностями. В общем, астрологи объявили эру ИИ-агентов. #AI #OpenAI #Operator 🙂 Artificial Intelion

Давным давно...
⚡️ Бывает так, что нейросетей вокруг много, а по душам поговорить не с кем. *️⃣ Реагируя на потребность человечества в душевных беседах, CEO Anthropic Дарио Амодеи заявил, что его стартап прямо сейчас работает над увеличением вычислительных мощностей для их детища - генеративного чат-бота Claude. *️⃣ Резкий рост спроса, который мы наблюдаем в течение года, и особенно в последние три месяца, превзошел нашу способность предоставлять необходимые вычисления, – пожаловался он в свежем интервью. *️⃣ Если коротко – в ближайшее время компания обещает разжиться мощностями, добавить в Claude двусторонний голосовой режим и способность запоминать сведения о пользователе, чтобы использовать в дальнейшем общении. В общем, чем мощнее сервер – тем теплей беседа! #AI #AnthropicAI #Claude 🙂 Artificial Intelion

Давным давно...
⚡️ Если вы еще не определились, за кого болеть в битве R1 VS o1, то вот основные факты. 🙂 Китайские товарищи из компании DeepSeek выпустили свою «самую умную рассуждающую модель» DeepSeek-R1. 🔣 И да, в некоторых бенчмарках она не хуже, а то и лучше о1 от OpenAI. Разумеется, не по всем и в довольно узком спектре задач – а все-таки. Если конкретно - в тестах AIME, MATH-500 и SWE-bench Verified. 🔣 Модель хорошо программирует, бодро рассуждает, практикует активный фактчекинг и содержит более 670 млрд параметров. Облегченные версии на подходе, они смогут работать на нотубуках, например. 🔣 Полновесная R1 требует более серьезной вычислительной мощи, но за этим вы всегда можете обратиться к нам. А еще заявлено, что модель «придерживается социалистических ценностей». Так что за работу, товарищи! *️⃣Интересно, что многие компании грозились выпускать больше маленьких и легких моделей, а в результате выпускают думающих гигантов. Да, пробовать можно бесплатно (50 запросов в сутки). #AI #DeepSeek #DeepSeekR1 🙂 Artificial Intelion