OpenAI представила лінійку ШІ-моделей GPT-5.2

Компанія OpenAI представила лінійку моделей GPT-5.2. З 12 грудня версії Instant, Thinking та Pro відкриті для всіх користувачів.

«Вже зараз користувачі ChatGPT Enterprise в середньому заощаджують 40–60 хвилин на день завдяки ШІ, а в активних юзерів показник понад 10 годин на тиждень. Ми розробили GPT-5.2, щоб розкрити ще більший економічний потенціал для людей», — йдеться в блозі стартапу.

Thinking показала високі результати в низці тестів.

Джерело: OpenAI.

Модель досягла рівня експерта в бенчмарку GDPval, що оцінює виконання інтелектуальних завдань у 44 професіях. Серед тестових завдань — створення презентацій і робота з таблицями.

Джерело: OpenAI.

«Думаюча» версія LLM справляється із завданнями бенчмарку GDPval у 11 разів швидше за експертів-людей, при цьому вартість виконання роботи становить менш як 1% витрат на спеціаліста.

Компанія підкреслила, що GPT-5.2 Thinking «підвищує планку професійної роботи». Вона демонструє:

  • сучасні методи міркувань із урахуванням довгого контексту;
  • суттєві покращення у генерації та аналізі електронних таблиць;
  • успіхи у створенні слайд-шоу.

Версія GPT-5.2 Instant створена для повсякденної роботи та навчання. Вона має теплий, розмовний стиль, чіткі пояснення з виділенням ключової інформації, покращені покрокові інструкції та якісний переклад технічної інформації.

GPT-5.2 Pro позиціонується як найпотужніше рішення для складних запитів. Нейромережа демонструє високу продуктивність у профільних сферах, включно з програмуванням і науковими дослідженнями.

«GPT-5.2 є частиною тривалого процесу вдосконалення моделей. Ми продовжуємо працювати над відомими проблемами на кшталт необґрунтованих відмов і затримок, щоб зробити продукт кориснішим», — підкреслили в OpenAI.

GPT-5.1 залишиться доступною для платних користувачів протягом трьох місяців.

Програмування

GPT‑5.2 Thinking встановила новий рекорд у тесті SWE-Bench Pro — 55,6%. Він аналізує здатність моделі працювати з чотирма мовами.

Джерело: OpenAI.

У тесті SWE-bench Verified також досягнуто високого значення — 80%.

«Для повсякденного професійного використання це означає, що модель надійніше налагоджує код, реалізує запити на нові функції, рефакторить великі кодові бази та виправляє від початку до кінця з меншим обсягом ручного втручання», — йдеться в блозі OpenAI.

GPT-5.2 Thinking краще показує себе у фронтенд-розробці та створенні складних і нетипових інтерфейсів порівняно з GPT-5.1 Thinking.

«GPT-5.2 — найбільший стрибок для моделей GPT у сфері агентного програмування від часів GPT-5 і є найкращим рішенням у своєму ціновому діапазоні», — зазначили в OpenAI.

Галюцинації та контекст

GPT‑5.2 Thinking менше галюцинує порівняно з GPT‑5.1 Thinking. Модель більш надійна в повсякденній роботі з інформацією, проведенні досліджень, написанні тексту, аналізі та підтримці ухвалення рішень.

Джерело: OpenAI.

GPT‑5.2 Thinking «встановлює новий стандарт» у сфері міркувань із довгим контекстом. Вона досягла провідних показників в OpenAI MRCRv2 — тесті, який перевіряє здатність моделі інтегрувати інформацію, розподілену по довгих документах.

У реальних задачах глибокого аналізу, які потребують пов’язаної інформації по сотнях тисяч токенів, GPT‑5.2 Thinking «значно точніша» за GPT‑5.1 Thinking.

Зір

GPT‑5.2 Thinking — найпотужніша модель зорового сприйняття OpenAI. Вона скорочує кількість помилок під час аналізу діаграм і розуміння програмного інтерфейсу приблизно вдвічі.

Нейромережа здатна точніше інтерпретувати інформаційні панелі, скриншоти, технічні графіки та звіти.

Порівняння аналізу зображення низької якості. Джерело: OpenAI.

На прикладі видно, що GPT-5.2 успішно визначає ключові зони й розставляє межі об’єктів. На відміну від неї, GPT-5.1 виділяє лише окремі фрагменти, демонструючи слабке розуміння просторової структури.

Хоча обидві моделі припускаються помилок, версія 5.2 справляється з аналізом зображення помітно краще.

Нагадаємо, у грудні OpenAI запланувала реліз GPT-5.2 як відповідь на зростання популярності Gemini від Google.

Читайте ForkLog UA в соціальних мережах

Знайшли помилку в тексті? Виділіть її та натисніть CTRL+ENTER

Матеріали за темою

Ми використовуємо файли cookie для покращення якості роботи.

Користуючись сайтом, ви погоджуєтесь з Політикою приватності.

OK
Exit mobile version