Grok 4 поступився o3 у шаховому турнірі


ШІ-модель o3 від OpenAI перемогла Grok 4 від xAI у чотирьох шахових партіях поспіль та здобула першість у турнірі в межах Game Arena від Google.
«Вони як талановита дитина, яка не знає, як рухаються фігури», — описав гру штучного інтелекту чемпіон світу Магнус Карлсен.
Триденний турнір, що відбувався з 5 по 7 серпня, зібрав чат-боти загального призначення, які грали в шахи. Моделі не налаштовували спеціально — перевірялися їхні навички та знання, отримані з інтернету.
Карлсен коментував фінал змагань. Він зазначив, що обидві системи грали на рівні випадкових гравців, які щойно вивчили правила. Такий рівень відповідає рейтингу близько 800 ELO. Для порівняння, у гросмейстера цей показник сягає 2839.
У першій партії Grok віддав одну з ключових фігур без боротьби та лише погіршив становище подальшими схожими ходами.
У другій грі він спробував реалізувати стратегію «отруєного пішака», коли фігуру можна взяти, але це призводить до серйозних проблем через підготовлену тактику суперника. Проте ШІ взяв не того пішака, і його ферзь опинився в пастці.
У третій партії Grok вибудував надійну позицію, але в середині гри почав віддавати фігури супернику.
У четвертій, фінальній грі o3 припустився помилки та втратив ферзя, але зумів здобути перемогу.
Третє місце посів Gemini від Google, обігравши іншу модель OpenAI.
Модель o3 прибрали з застосунку ChatGPT після виходу GPT-5. Тепер користувачам доступні лише остання версія та її «аналітична» модифікація.
Нагадаємо, у грудні 2024 року o1-preview, маніпулюючи файловою системою, самостійно й без підказок зламала тестове середовище, аби не програти Stockfish у шахи.