Давным давно...

😍 Заметили новый тренд: шутки об «ИИ, который поработит человечество» уже не в моде. На смену им приходит романтичная подача: релиз каждой новой модели старается перещеголять остальные и чуть не стихи ей посвящает. 💕Яркий пример – китайская компания Alibaba, которая представила QwQ-32B-Preview – «модель, ориентированную на глубокие рассуждения». Вот, что пишут в анонсе: Как вечный ученик мудрости, наша модель подходит к каждой проблеме — будь то математика, код или знание нашего мира — с подлинным удивлением и сомнением. QwQ воплощает древний философский дух: она знает, что ничего не знает, и именно это движет еe любопытством. Прежде чем остановиться на каком-либо ответе, она обращается внутрь себя, подвергая сомнению свои собственные предположения, исследуя различные пути мысли, всегда ища более глубокую истину. 🔹 Поэму целиком можно прочитать в их блоге. 🔹 А всякую прозу вроде кода, параметров (кстати, весьма приличных), количества слоев, уровней внимания и показателей производительности смотрим здесь. #AI #Alibaba #QwQ 🙂 Artificial Intelion

Давным давно...

🙂 Fugatto от Nvidia: зеленый гигант анонсировал «модель синтеза и преобразования звука, способную выполнять текстовые инструкции, написанные в свободной форме». 🔷 Фактически, это означает, что музыку, странные звуки и фоны для роликов теперь можно будет добывать из самых фантастических промтов text2audio. 🔹 В релизе подмечено, что большие модели ограничены исключительно объёмом данных, т. к. сами аудиофайлы не содержат инструкции по их генерации. 🔹 А для Fugatto обещают «специализированный подход к генерации данных, оптимизированный для всего спектра задач по генерации и преобразованию аудиосигнала», что фактически обеспечит соответствие данных между аудио и естественным языком. 🔹 Подробности о технологии вывода, классификаторах и параметрах – здесь. А для хейтеров сказано, что электронная музыка уже лет 50 как никого не смущает, только теперь, благодаря ИИ, она станет реально общим полем для творчества. #AI #Nvidia #Fugatto 🙂 Artificial Intelion

Читайте в Telegram

В нашем канале мы анализируем и тестируем LLMs, следим за трендами и рассказываем, как AI меняет мир.

Перейти в канал
Интелион Облако

Давным давно...

👍 Китайские коллеги предложили использовать диффузионные трансформаторы (DiT) для генерации изображений «путем простого объединения маркеров внимания». 🔷 По сути – теперь можно дообучить генератор в контексте промта с Lora (In-Context LoRA for Diffusion Transformers). Создатели уверяют, что придумали «удивительно простой конвейер» со следующими функциями: 🔹 объединять изображения вместо токенов; 🔹 выполнять совместное субтитрование нескольких изображений; 🔹 применять настройку LoRA для конкретных задач с использованием небольших наборов данных (например, 20 образцов) вместо полной настройки с большими наборами данных. В результате – раскадровка фильмов, портретные серии, создание «визуальной идентичности», шрифтов, фонов, спецэффектов и брендовых картинок. Стильно, модно, молодежно. Подробности и код - здесь. #AI #LoRA #DiT 🙂 Artificial Intelion

Давным давно...

👍 Или, например, GigaChat (для любителей отечественного). 🔷 Недавно релизнули GigaСhat MAX с доступом в tg-боте, веб-версии, через API - в режиме раннего доступа. 🔹 Новая модель понимает картинки, неплохо выглядит по бенчмаркам: — 3 место на MERA, за gpt-4o и Llama-405B — 92% правильных ответов на GSM-8k, 80% на MMLU и 75% на MMLU-RU — на SBS с учётом красоты ответов модель выигрывает в 61% случаев у GPT-4 turbo и в 67% случаев у YaGPT-4 Pro. — на Arena-Hard модель достигает 51% скора против GPT-4-0314 — на Vkhr Arena-General-RU модель достигает 90%, в то время как YaGPT-4 Pro достигает 59%. 🔹 И еще есть в ней что-то такое, душевное. Хвалёнушка там, кот Баюн, хорошее понимание естественного русского. Ни к чему не призываем, просто вносим разнообразие) #AI #GigaChat 🙂 Artificial Intelion

Давным давно...

🌎 Давно ли вы были в библиотеке? Мы вот только что. Google не так давно открыл доступ к Gemini через библиотеку OpenAI и там появляется все больше интересного. 🔵 Разработчики могут использовать модели Gemini от Google через библиотеку OpenAI и REST API. Поддерживаются API завершения чата и API эмбедингов. Google обещал расширить совместимость в самое ближайшее время. 🔷 Есть примеры кода на разных языках: Python, Typescript/Javascript и REST для взаимодействия с Gemini API. По совету Google те, кто не использует, библиотеки OpenAI, могут сразу обращаться к Gemini API. Читательский билет не требуют) #AI #GoogleAI #Gemini 🙂 Artificial Intelion

Давным давно...

😊 Ожившие фотографии всегда немного пугают, но сервисы по их оживлению – завораживают. 🔵 Компания ByteDance предлагает добавить жизни в ваш фотоальбом с помощью ИИ-сервиса “X-Portrait 2”. Он не просто заставит лица на фото поморгать или улыбнуться, но добавит эмоций, драмы, динамики и вообще снимет маленькое кино, потому что обучен на сценах из фильмов. 🔷 Можно собственным лицом исполнить сцены из блокбастеров, ужастиков и всего, на что хватит фантазии. 🔹 Развлекательные цели понятны, но ведь есть еще реклама, лендинги и бесконечные творческие возможности. Предыдущая версия выдавала мультипликацию, а эта обещает шедевры. #AI #XPortrait2 #ByteDance 🙂 Artificial Intelion

Давным давно...

🙂 Windows заколлабился с ChatGPT и GitHub Copilot. 🔷 В чем суть: компания Microsoft добавила поддержку чат-ботов с ИИ в Windows Terminal. Правила и подробности, как водится, на ГитХабе. 🔹 После установки Windows Terminal Canary включаем «Terminal Chat» в меню и добавляем ключ API от OpenAI, GitHub или Azure. Готово, вы восхитительны. 🔹 И все шаманство для того, чтобы использовать все возможности ChatGPT, не покидая среды терминала. Больше коллабораций хороших и разных! #AI #Microsoft #WindowsTerminal 🙂 Artificial Intelion