Из ТГ канала

👍 Китайские коллеги предложили использовать диффузионные трансформаторы (DiT) для генерации изображений «путем простого объединения маркеров внимания».
🔷 По сути – теперь можно дообучить генератор в контексте промта с Lora (In-Context LoRA for Diffusion Transformers).
Создатели уверяют, что придумали «удивительно простой конвейер» со следующими функциями:
🔹 объединять изображения вместо токенов;
🔹 выполнять совместное субтитрование нескольких изображений;
🔹 применять настройку LoRA для конкретных задач с использованием небольших наборов данных (например, 20 образцов) вместо полной настройки с большими наборами данных.
В результате – раскадровка фильмов, портретные серии, создание «визуальной идентичности», шрифтов, фонов, спецэффектов и брендовых картинок. Стильно, модно, молодежно.
Подробности и код - здесь.
🙂 Artificial Intelion
Новости AI
#AI
#LoRA
#DiT
Рекомендуем прочесть:
- Tesla A100 40GB vs A100 80GB: Как выбрать GPU для ИИ, LLM и Data Science
- Что такое GPU сервер и как его арендовать?
- Tesla A10 vs RTX 3090 — оптимальный выбор GPU для ваших нейросетей
- Зачем вам нужна Tesla A100 80 ГБ — и почему в «Интелион Облако» она раскрывается на максимум
- От идеи до реализации за часы — как AI меняет работу и быт