Grok 4 поступився o3 у шаховому турнірі

ШІ-модель o3 від OpenAI перемогла Grok 4 від xAI у чотирьох шахових партіях поспіль та здобула першість у турнірі в межах Game Arena від Google.

«Вони як талановита дитина, яка не знає, як рухаються фігури», — описав гру штучного інтелекту чемпіон світу Магнус Карлсен.

Триденний турнір, що відбувався з 5 по 7 серпня, зібрав чат-боти загального призначення, які грали в шахи. Моделі не налаштовували спеціально — перевірялися їхні навички та знання, отримані з інтернету.

Карлсен коментував фінал змагань. Він зазначив, що обидві системи грали на рівні випадкових гравців, які щойно вивчили правила. Такий рівень відповідає рейтингу близько 800 ELO. Для порівняння, у гросмейстера цей показник сягає 2839.

У першій партії Grok віддав одну з ключових фігур без боротьби та лише погіршив становище подальшими схожими ходами.

У другій грі він спробував реалізувати стратегію «отруєного пішака», коли фігуру можна взяти, але це призводить до серйозних проблем через підготовлену тактику суперника. Проте ШІ взяв не того пішака, і його ферзь опинився в пастці.

У третій партії Grok вибудував надійну позицію, але в середині гри почав віддавати фігури супернику.

У четвертій, фінальній грі o3 припустився помилки та втратив ферзя, але зумів здобути перемогу.

Grok 4 поступився o3 у шаховому турнірі
Турнірна сітка. Дані: шаховий турнір від Google.

Третє місце посів Gemini від Google, обігравши іншу модель OpenAI.

Модель o3 прибрали з застосунку ChatGPT після виходу GPT-5. Тепер користувачам доступні лише остання версія та її «аналітична» модифікація.

Нагадаємо, у грудні 2024 року o1-preview, маніпулюючи файловою системою, самостійно й без підказок зламала тестове середовище, аби не програти Stockfish у шахи.

Читайте ForkLog UA в соціальних мережах

Знайшли помилку в тексті? Виділіть її та натисніть CTRL+ENTER

Матеріали за темою

Ми використовуємо файли cookie для покращення якості роботи.

Користуючись сайтом, ви погоджуєтесь з Політикою приватності.

OK