Из ТГ канала

ChatGPT попытался написать лучшую версию себя
Компания Марка Цукерберга проверила, могут ли AI-ассистенты улучшать уже существующий код, и ускорила обучение модели GPT-2 с помощью проекта NanoGPT.
Итоги оказались скромными: с лучшими подсказками (псевдокод и детальное описание) самые успешные агенты с трудом смогли воспроизвести хотя бы 40% от прироста производительности, достигнутого человеком.
Что для этого использовали:
⚡️ NanoGPT — минималистичный фреймворк, идеально подходящий для экспериментов.
⚡️ LLM-Speedrunner — автоматизированный подход Meta для ускорения обучения моделей.
⚡️ Инструкция по добавлению моделей и задач.
⚡️ Научная статья с подробностями тестирования и бенчмарками.
Хотите повторить эксперимент самостоятельно?
⚡️ Уже в субботу, 5 июля в 10:30, мы подведём итоги розыгрыша серверов от Интелион Облако — получите шанс запустить свой ИИ локально и протестировать оптимизации на собственной инфраструктуре.
🙂 Artificial Intelion
Новости AI
#ии
#нейросети
#aiassistant
Рекомендуем прочесть:
- Tesla A100 40GB vs A100 80GB: Как выбрать GPU для ИИ, LLM и Data Science
- Что такое GPU сервер и как его арендовать?
- Tesla A10 vs RTX 3090 — оптимальный выбор GPU для ваших нейросетей
- Зачем вам нужна Tesla A100 80 ГБ — и почему в «Интелион Облако» она раскрывается на максимум
- От идеи до реализации за часы — как AI меняет работу и быт