Интелион Облако

Новости AI

28 апреля 2025 г.

❓

Как добраться до труднодоступных мест? Для ответа на этот вопрос OpenAI выпустили BrowseComp — бенчмарк, который показывает, кто из ИИ-агентов реально копает в интернете, а кто так, в полссылочки.

✅ Там почти 1,5 тысячи задач на терминологию, уточнения, контекст - ну, вот это вот всё.

✅ Задачи реально сложные, из серии "Давайте найдем примечания к статье, опубликованной в сборнике студенческих работ Гарвардского университета за 1989 год, который, возможно, был оцифрован в 2003-м". Ну, мы немножко утрируем, но имеется в виду реально глубокий поиск для серьезных исследований.

*️⃣Учитываются только однозначные ответы, без вот этих хитростей с "текст недоступен" и "URL гипотетический".

*️⃣Таким образом можно выявить модели, которые действительно умеют в DeepSearch и те, кто просто притворяется, что готов работать. Это наверняка скажется не рейтинге моделей для университетов и исследовательских компаний.

❤️Но и простым юзерам не помешает знать, кто из ИИ-агентов действительно может побегать за них по библиотекам!

🙂

Artificial Intelion

Новости AI

#ии

#OpenAI

#BrowseCamp

Рекомендуем прочесть:

Читайте в Telegram

В нашем канале мы анализируем и тестируем LLMs, следим за трендами и рассказываем, как AI меняет мир.

Перейти в канал

28 апреля

❓ Как добраться до труднодоступных мест? Для ответа на этот вопрос OpenAI выпустили BrowseComp — бенчмарк, который показывает, кто из ИИ-агентов реально копает в интернете, а кто так, в полссылочки.✅ Там почти 1,5 тысячи задач на терминологию, уточнения, контекст - ну, вот это вот всё. ✅ Задачи реально сложные, из серии "Давайте найдем примечания к статье, опубликованной в сборнике студенческих работ Гарвардского университета за 1989 год, который, возможно, был оцифрован в 2003-м". Ну, мы немножко утрируем, но имеется в виду реально глубокий поиск для серьезных исследований. *️⃣Учитываются только однозначные ответы, без вот этих хитростей с "текст недоступен" и "URL гипотетический". *️⃣Таким образом можно выявить модели, которые действительно умеют в DeepSearch и те, кто просто притворяется, что готов работать. Это наверняка скажется не рейтинге моделей для университетов и исследовательских компаний. ❤️Но и простым юзерам не помешает знать, кто из ИИ-агентов действительно может побегать за них по библиотекам! 🙂 Artificial Intelion

22 апреля

😍 Видите этот милый пузатенький тостер на фото? Так вот, это вообще не тостер, это вершина современных технологий, полноценный физический ИИ.Samsung и Google объединились и породили робота по имени Ballie со встроенной Gemini AI. А это означает мультимодальные возможности, обработку голосовых, визуальных и аудиоданных, управление домашними устройствами, общение, советы по здоровью и стилю. В релизе зачем-то сказано, что у Ballie «мужской характер» – ну, это уже по дизайну понятно, он практически Карлсон!Продажи в США и Корее обещают уже этим летом, потом волна роботомании докатится и до наших берегов.Интересен, конечно, не сам факт наличия ИИ-робота, а то, с какой силой нейросети рвутся в физический мир. Посмотрим, как им тут понравится! 😈 🙂 Artificial Intelion

21 апреля

Это пост для богатых. Если вы чайный пакетик два раза завариваете – вам не сюда явно.❗️Дальнейшая информация только для наших зажиточных подписчиков: компания Anthropic объявила о запуске нового плана подписки на своего чат-бота на основе ИИ Claude Max. И это 200 долларов в месяц. 💲 Из интересного – Max поставляется в двух вариантах с разными ценами и лимитами. Есть тариф Max за $100 в месяц с лимитами в 5 раз выше, чем у Claude Pro, и тариф Max за $200 в месяц с лимитами в 20 раз выше.💶 При этом безлимитного тарифа нет ни за какие деньги, а в будущем компания обещает – правильно, еще более дорогие подписки!Да, конечно, Anthropic вкладывается в разработку передовых моделей, и по слухам, новая Claude 3.7 Sonnet выше всех похвал, и дает суперточные ответы на вопросы, но за 200 долларов в месяц можно спросить у кого-нибудь еще! А ведь на подходе Claude for Education – программа для университетских клиентов, которая предоставит колледжам «особые возможности и преимущества» за хорошие деньги. И это не методичку купить, это будут прям деньги!💰Кажется, монетизация «тяжелых моделей» выходит на новый уровень. 3.7 Sonnet🙂 Artificial Intelion

Читать все