Свежая версия ИИ Google Gemini обошла в тестах GPT-4o и Claude-3

Последняя версия большой языковой модели Gemini 1.5 Pro внезапно пробилась на верхушку рейтинга на платформе Chatbot Arena, обойдя в тестах традиционных лидеров в области генеративного искусственного интеллекта — OpenAI GPT-4o и Anthropic Claude-3.

Источник изображения: blog.google

Бывшая прежде чемпионом нейросеть OpenAI GPT-4o уступила лидерство 1 августа, когда Google без громких анонсов выпустила экспериментальную сборку своей последней модели — она быстро привлекла интересующееся ИИ сообщество в соцсетях, которое сочло победу в бенчмарке свидетельством качества. Сервис OpenAI ChatGPT стал почти синонимом генеративного ИИ с момента запуска ещё в эпоху GPT-3. К настоящему моменту устоявшимися лидерами считаются OpenAI GPT-4o и Anthropic Claude-3, которые за последний год почти не знали конкурентов в тестах.

Источник изображения: x.com/lmsysorg

Один из наиболее популярных тестов — LMSYS Chatbot Arena. Он предлагает моделям различные задачи и присваивает им оценки. Актуальная версия GPT-4o смогла набрать 1286 баллов, а Claude-3 — 1271 балл. У предыдущей Google Gemini 1.5 Pro рейтинг был 1261, но выпущенная 1 августа Gemini 1.5 Pro 0801 внезапно получила колоссальные 1300 баллов. Это может свидетельствовать, что новая нейросеть Google способнее своих конкурентов, но бенчмарки не всегда точно отражают, что может и чего не может модель ИИ.

Современный рынок чат-ботов уже достаточно созрел, чтобы предложить потребителю несколько вариантов и дать ему возможность самому решить, какой ИИ подходит лучше всего. Пока нет ясности, станет ли экспериментальная Gemini 1.5 Pro версией по умолчанию в будущем. Она остаётся общедоступной, но с экспериментальным статусом может быть закрыта или радикально отредактирована по соображениям безопасности или другим причинам.

Источник: 3dnews.ru

«Прощайтесь со своим свободным временем»: ветераны World of Warcraft анонсировали кооперативные приключения в подземельях Fellowship

Сб Авг 3 , 2024

Шведская студия Chief Rebel, состоящая из ветеранов разработки World of Warcraft, Diablo, Helldivers, Battlefield и The Division, при поддержке издателя Arc Games представила дебютную игру — Fellowship. Источник изображений: Arc Games Fellowship позиционируется как первое в истории многопользовательское онлайн-приключение в подземельях, или MODA. Проект сочетает полюбившиеся игрокам элементы MMO, MOBA […]

Свежая версия ИИ Google Gemini обошла в тестах GPT-4o и Claude-3

«Прощайтесь со своим свободным временем»: ветераны World of Warcraft анонсировали кооперативные приключения в подземельях Fellowship

Neuralink вживила имплант в мозг своего второго пациента

Крупнейшие интернет-издания заблокировали доступ ИИ-поисковику OpenAI SearchGPT к своим материалам

Биткоин упал ниже отметки $60 000 и может продолжить падение

Хакеры научились массовой и незаметной рассылке вредоносного ПО через взлом интернет-провайдеров

Китай почти достиг «базовой самодостаточности» в производстве оборудования для выпуска чипов

Представлен первый в мире калиево-ионный аккумулятор стандартного форм-фактора 18650

Просмотр видео высокого качества на YouTube стал затруднителен для большинства россиян

Apple начала выплаты компенсаций пользователям MacBook с клавиатурой «бабочка»

«Верните физику оригинальной Titan Quest»: геймплейная демонстрация сиквела ролевого экшена прошла не совсем гладко

Руководство Samsung признало, что компания попадёт в «порочный круг», если её сотрудники не будут спорить

Подробную демонстрацию геймплея Sid Meier’s Civilization VII покажут уже в августе

Для Pinball FX представили 2 новых стола, один из них по Goat Simulator

«Xbox никому не нужны»: поэтому Phantom Blade Zero не выйдет на консолях Microsoft

Несмотря на заявления о «реструктуризации», партнеры Humble Games говорят о закрытии

Kingdom Come: Deliverance II выдали возрастной рейтинг

Microsoft хочет вернуть славные дни Xbox 360 с помощью Game Pass

Новая реклама Game Pass напоминает о бонусах для игроков в Valorant

Pneumata выйдет на Xbox Series X | S уже 20 августа

Эти 15+ игр выйдут на Xbox на следующей неделе: 6-9 августа + релизы в Game Pass

Новости Game Pass за 27 июля — 3 августа: анонсы и слухи, игры на удаление, плюс другие материалы