Как добраться до труднодоступных мест?

Из ТГ канала

❓ Как добраться до труднодоступных мест? Для ответа на этот вопрос OpenAI выпустили BrowseComp — бенчмарк, который показывает, кто из ИИ-агентов реально копает в интернете, а кто так, в полссылочки.

✅ Там почти 1,5 тысячи задач на терминологию, уточнения, контекст - ну, вот это вот всё.

✅ Задачи реально сложные, из серии "Давайте найдем примечания к статье, опубликованной в сборнике студенческих работ Гарвардского университета за 1989 год, который, возможно, был оцифрован в 2003-м". Ну, мы немножко утрируем, но имеется в виду реально глубокий поиск для серьезных исследований.

*️⃣Учитываются только однозначные ответы, без вот этих хитростей с "текст недоступен" и "URL гипотетический".

*️⃣Таким образом можно выявить модели, которые действительно умеют в DeepSearch и те, кто просто притворяется, что готов работать. Это наверняка скажется не рейтинге моделей для университетов и исследовательских компаний.

❤️Но и простым юзерам не помешает знать, кто из ИИ-агентов действительно может побегать за них по библиотекам!

🙂 Artificial Intelion

Новости AI

#ии

#OpenAI

#BrowseCamp

Рекомендуем прочесть:

Читайте в Telegram

В нашем канале мы анализируем и тестируем LLMs, следим за трендами и рассказываем, как AI меняет мир.

Перейти в канал

Давным давно...

Как подключиться к серверу в Интелион Облако? Мы сняли два видео, где пошагово показываем, как реально просто подключиться к своему серверу в Интелион Облаке через два протокола: ☹️ SSH-подключение Показываем, как быстро и безопасно войти на сервер из терминала. Разбираемся с ключами, логином и настраиваем первый вход без головной боли. ☹️ VNC-доступ Если нужен графический интерфейс: как открыть удалённый рабочий стол, зайти в окружение и работать с GPU «вживую», как на своём ПК. Работа с нами — буст для ваших бизнес-проектов: ☹️ Ускорение вычислений для обучения LLM (несколько часов на сервере вместо недель на собственном ПК) ☹️ GPU-серверы с большим объёмом VRAM (>24 Gb) для работы с большими моделями и Computer Vision ☹️ Молниеносный анализ больших данных с Dask и Apache Spark ☹️ Поддержка генеративных моделей Stable Diffusion и Flux 1 Dev Арендовать сервер: intelion.cloud

Давным давно...

😂 AI Talks состоялся! Неделю назад провели насыщенный разговор с экспертами Интелион Облако — Антоном Крупновым (Product Manager) и Вероникой (Marketing Manager). Обсудили, как нейросети меняют нашу жизнь и работу, разобрали личные кейсы и поделились инструментами, которые уже сегодня экономят нам часы, дни и даже недели! В выпуске: ☹️Как начать работать с AI и какие инструменты выбрать? ☹️Примеры решения задач с помощью ChatGPT и Cursor. ☹️Будущее работы и бизнеса глазами тех, кто уже живёт в мире нейросетей. ☹️ Запись доступна на Rutube и ВК Видео! #AITalks #Intelion #Нейросети #ИИ 🙂 Artificial Intelion

Давным давно...

Где найти GPU для ML, чтобы было быстро и без переплат? Когда нейросеть уже написана, дата-сет подготовлен, а железо внезапно закончилось — мы готовы помочь. В Интелион Облако вы можете быстро и просто арендовать самые востребованные видеокарты для ваших AI-проектов: Почему стоит запускать GPU именно в Intelion.cloud? ☹️ Готовы к старту за 2 минуты GPU уже ждут в стойке — вам останется лишь подключиться. ☹️ Прозрачные и понятные цены Без скрытых платежей, переплат и комиссий. ☹️ Гибкие конфигурации Сервер под ваши задачи — от одиночного GPU до мульти-кластеров с полной инфраструктурой. ☹️ Иммерсионное охлаждение Максимальная производительность GPU без троттлинга. ☹️ Техподдержка всегда на связи Инженеры, которые разбираются в ML-стеке и GPU. ☹️ Дата-центры в РФ Ускорьте обучение своей LLM - Intelion.cloud #ии #нейросети #gpuсервер #llm 🙂 Artificial Intelion

Читать все