OpenAI представила лінійку ШІ-моделей GPT-5.2
Компанія OpenAI представила лінійку моделей GPT-5.2. З 12 грудня версії Instant, Thinking та Pro відкриті для всіх користувачів.
GPT-5.2 is now rolling out to everyone.https://t.co/nfubPwnIIw
— OpenAI (@OpenAI) December 11, 2025
«Вже зараз користувачі ChatGPT Enterprise в середньому заощаджують 40–60 хвилин на день завдяки ШІ, а в активних юзерів показник понад 10 годин на тиждень. Ми розробили GPT-5.2, щоб розкрити ще більший економічний потенціал для людей», — йдеться в блозі стартапу.
Thinking показала високі результати в низці тестів.
Модель досягла рівня експерта в бенчмарку GDPval, що оцінює виконання інтелектуальних завдань у 44 професіях. Серед тестових завдань — створення презентацій і робота з таблицями.
«Думаюча» версія LLM справляється із завданнями бенчмарку GDPval у 11 разів швидше за експертів-людей, при цьому вартість виконання роботи становить менш як 1% витрат на спеціаліста.
Компанія підкреслила, що GPT-5.2 Thinking «підвищує планку професійної роботи». Вона демонструє:
- сучасні методи міркувань із урахуванням довгого контексту;
- суттєві покращення у генерації та аналізі електронних таблиць;
- успіхи у створенні слайд-шоу.
Версія GPT-5.2 Instant створена для повсякденної роботи та навчання. Вона має теплий, розмовний стиль, чіткі пояснення з виділенням ключової інформації, покращені покрокові інструкції та якісний переклад технічної інформації.
GPT-5.2 Pro позиціонується як найпотужніше рішення для складних запитів. Нейромережа демонструє високу продуктивність у профільних сферах, включно з програмуванням і науковими дослідженнями.
«GPT-5.2 є частиною тривалого процесу вдосконалення моделей. Ми продовжуємо працювати над відомими проблемами на кшталт необґрунтованих відмов і затримок, щоб зробити продукт кориснішим», — підкреслили в OpenAI.
GPT-5.1 залишиться доступною для платних користувачів протягом трьох місяців.
Програмування
GPT‑5.2 Thinking встановила новий рекорд у тесті SWE-Bench Pro — 55,6%. Він аналізує здатність моделі працювати з чотирма мовами.
У тесті SWE-bench Verified також досягнуто високого значення — 80%.
«Для повсякденного професійного використання це означає, що модель надійніше налагоджує код, реалізує запити на нові функції, рефакторить великі кодові бази та виправляє від початку до кінця з меншим обсягом ручного втручання», — йдеться в блозі OpenAI.
GPT-5.2 Thinking краще показує себе у фронтенд-розробці та створенні складних і нетипових інтерфейсів порівняно з GPT-5.1 Thinking.
«GPT-5.2 — найбільший стрибок для моделей GPT у сфері агентного програмування від часів GPT-5 і є найкращим рішенням у своєму ціновому діапазоні», — зазначили в OpenAI.
Галюцинації та контекст
GPT‑5.2 Thinking менше галюцинує порівняно з GPT‑5.1 Thinking. Модель більш надійна в повсякденній роботі з інформацією, проведенні досліджень, написанні тексту, аналізі та підтримці ухвалення рішень.
GPT‑5.2 Thinking «встановлює новий стандарт» у сфері міркувань із довгим контекстом. Вона досягла провідних показників в OpenAI MRCRv2 — тесті, який перевіряє здатність моделі інтегрувати інформацію, розподілену по довгих документах.
У реальних задачах глибокого аналізу, які потребують пов’язаної інформації по сотнях тисяч токенів, GPT‑5.2 Thinking «значно точніша» за GPT‑5.1 Thinking.
Зір
GPT‑5.2 Thinking — найпотужніша модель зорового сприйняття OpenAI. Вона скорочує кількість помилок під час аналізу діаграм і розуміння програмного інтерфейсу приблизно вдвічі.
Нейромережа здатна точніше інтерпретувати інформаційні панелі, скриншоти, технічні графіки та звіти.
На прикладі видно, що GPT-5.2 успішно визначає ключові зони й розставляє межі об’єктів. На відміну від неї, GPT-5.1 виділяє лише окремі фрагменти, демонструючи слабке розуміння просторової структури.
Хоча обидві моделі припускаються помилок, версія 5.2 справляється з аналізом зображення помітно краще.
Нагадаємо, у грудні OpenAI запланувала реліз GPT-5.2 як відповідь на зростання популярності Gemini від Google.