OpenAI представила флагманську ШІ‑модель GPT‑5.5

Компанія OpenAI випустила GPT‑5.5. Модель позиціонують як «новий рівень інтелекту для реальної роботи та керування агентами».

Нейромережа «створена для розуміння складних завдань, використання інструментів, перевірки результатів роботи та доведення більшої кількості задач до кінця».

Модель вміє розуміти наміри користувача, самостійно планувати роботу і доводити задачі до фінального результату. GPT‑5.5 «відмінно справляється» з написанням і відлагодженням коду, пошуком інформації в інтернеті, аналізом даних, створенням документів і таблиць, керуванням ПЗ та перемиканням між інструментами.

«Замість ретельного контролю кожного кроку ви можете доручити GPT‑5.5 складне багатоетапне завдання і довіритися їй у плануванні, застосуванні інструментів, перевірці своєї роботи, подоланні неоднозначностей і продовженні роботи», — йдеться в анонсі.

Тести GPT‑5.5 у різних бенчмарках. Джерело: OpenAI.

OpenAI зазначила, що нова модель особливо ефективна в агентному програмуванні, керуванні комп’ютером, інтелектуальній роботі та ранніх наукових дослідженнях — сферах, де важливо вибудовувати довгі ланцюжки міркувань і дій.

«GPT‑5.5 забезпечує стрибок в інтелекті без шкоди для швидкості. Більш великі та потужні моделі часто працюють повільніше, але GPT‑5.5 відповідає GPT‑5.4 за затримкою на токен у реальних умовах, водночас демонструючи значно вищий рівень інтелекту», — заявили у стартапі.

Нейромережа використовує «суттєво менше» токенів під час роботи в Codex.

OpenAI повідомила про застосування «найпотужнішого» набору заходів безпеки перед релізом. Компанія співпрацювала з внутрішніми та зовнішніми спеціалістами.

Доступність

GPT‑5.5 працює в ChatGPT і Codex для користувачів планів Plus, Pro, Business і Enterprise. Окрема версія GPT‑5.5 Pro представлена для Pro, Business і Enterprise.

Найближчим часом обидві варіації з’являться через API за ціною $5 млн за 1 млн вхідних токенів і $30 млн — вихідних. Вікно контексту — 1 млн токенів.

У Codex GPT‑5.5 доступна для тарифних планів Plus, Pro, Business, Enterprise, Edu і Go з вікном контексту 400 000. GPT‑5.5 представлена в режимі Fast, генеруючи токени в 1,5 раза швидше за 2,5х вартості.

GPT‑5.5 дорожча за GPT‑5.4. Це пояснюється вищою ефективністю використання токенів.

Можливості GPT‑5.5

Нова модель витрачає менше токенів і рідше вдається до повторних спроб під час розв’язання задач. В індексі програмування Artificial Analysis вона забезпечує «передовий рівень інтелекту» за вдвічі менших витрат порівняно з конкурентами.

Джерело: OpenAI.

GPT‑5.5 — найпотужніше рішення компанії в галузі агентного програмування. У Terminal‑Bench 2.0, де тестують складні сценарії роботи в командному рядку, точність — 82,7%.

У SWE‑Bench Pro результат становив 58,6%, в Expert‑SWE нейромережа перевершила GPT‑5.4.

За всіма трьома бенчмарками новинка обійшла попередницю, водночас витративши менше токенів.

Джерело: OpenAI.

«Сильні сторони моделі в галузі програмування особливо яскраво проявляються в Codex, де вона здатна виконувати інженерні задачі — від реалізації та рефакторингу до відлагодження, тестування та валідації», — йдеться в блозі компанії.

GPT‑5.5 краще розуміє влаштування системи: чому щось не працює, де потрібно внести виправлення і які частини коду це зачепить.

Модель «помітно перевершує» GPT‑5.4 і Claude Opus 4.7 за здатністю до логічного мислення та автономності: вона заздалегідь виявляє проблеми, прогнозує потреби в тестуванні та рецензуванні без явних підказок.

У тесті GDPval⁠⁠, який перевіряє здатність агентів виконувати чітко визначені інтелектуальні задачі в 44 професіях, GPT‑5.5 набирає 84,9%. В OSWorld‑Verified — 78,7%, у Tau2‑bench — 98%.

Джерело: OpenAI.

GPT‑5.5 показує високі результати й в інших тестах: 60% у FinanceAgent, 88,5% — у задачах внутрішнього моделювання інвестиційного банкінгу та 54,1% — в OfficeQA Pro.

Джерело: OpenAI.

Робота з інформацією

GPT‑5.5 є «потужним інструментом для повсякденної роботи на комп’ютері». Модель краще розуміє задум користувача і впевненіше проходить увесь цикл роботи з інформацією: пошук, аналіз, використання інструментів, перевірка та перетворення вихідних даних у готовий результат.

У Codex GPT‑5.5 перевершує GPT‑5.4 у створенні документів, таблиць і слайд‑презентацій.

Понад 85% співробітників різних підрозділів OpenAI щотижня використовують Codex, зокрема в розробці ПЗ, фінансах, комунікаціях, маркетингу, аналітиці даних і продакт‑менеджменті.

Наукові дослідження

У науково‑технічних робочих процесах GPT‑5.5 також показує вищі результати. Йдеться про задачі, які не зводяться до відповіді на конкретне запитання: модель здатна послідовно вивчати ідею, збирати докази, перевіряти гіпотезу та інтерпретувати отримані дані.

Джерело: OpenAI.

GPT‑5.5 демонструє поліпшення порівняно з GPT‑5.4 на GeneBench — платформі для багатоетапного аналізу наукових даних у генетиці та кількісній біології.

У BixBench нова модель також перевершила попередницю.

Джерело: OpenAI.

Нагадаємо, у квітні OpenAI представила «агентів для робочої області» в ChatGPT. Команди можуть створювати спільних асистентів для розв’язання складних задач і тривалих процесів.

Читайте ForkLog UA в соціальних мережах

Знайшли помилку в тексті? Виділіть її та натисніть CTRL+ENTER

Матеріали за темою

Ми використовуємо файли cookie для покращення якості роботи.

Користуючись сайтом, ви погоджуєтесь з Політикою приватності.

OK
Exit mobile version