OpenAI випустила флагманську ШІ-модель GPT-5


Компанія OpenAI запустила нову флагманську ШІ-модель, яка стане основою наступного покоління ChatGPT.
GPT-5 is here.
Rolling out to everyone starting today.https://t.co/rOcZ8J2btI pic.twitter.com/dk6zLTe04s
— OpenAI (@OpenAI) August 7, 2025
GPT-5 — перша «уніфікована» нейромережа, що поєднує режим послідовних міркувань і швидких відповідей у стилі GPT. Спеціальний маршрутизатор визначає, який підхід застосувати для виконання завдання: дати швидку відповідь або витратити більше часу на обдумування, щоб підвищити якість результату.
GPT-4 дозволяв чат-боту відповідати на широкий спектр запитань. GPT-5 уже здатна виконувати завдання від імені користувача, зокрема створювати програмні застосунки, працювати з календарем або формувати дослідницькі звіти.
CEO стартапу Сем Альтман назвав GPT-5 «найкращою моделлю у світі» та «значним кроком» до створення загального штучного інтелекту, здатного перевершити людину в найбільш економічно цінній роботі.
GPT-5 доступна безкоштовним користувачам із певними лімітами, для власників Plus і Pro вони збільшені.
Через API пропонуються три моделі: GPT-5, GPT-5 mini, GPT-5 nano.
Бенчмарки
OpenAI позиціонує GPT-5 як передову в кількох напрямах. За низкою показників вона випереджає розробки Anthropic, Google DeepMind та xAI, хоча в окремих сферах поступається конкурентам.
Серед сильних сторін нової моделі — програмування. У тесті SWE-bench Verified вона набрала 74,9% з першої спроби, обійшовши Claude Opus 4.1 (74,5%) і Gemini 2.5 Pro (59,6%).
В одному з прикладів GPT-5 створила інтерактивний матеріал для пояснення складних концепцій, зокрема ефекту Бернуллі, згенерувавши сотні рядків коду за кілька хвилин.
demo time:
GPT-5 can make something interactive to explain complex concepts like the bernoulli effect to you, churning out hundreds of lines of code in a couple of minutes. pic.twitter.com/cIU7O608TT
— Sam Altman (@sama) August 7, 2025
В іншому випадку модель створила вебзастосунок для вивчення французької мови.
У тесті Humanity’s Last Exam, що оцінює роботу ШІ в математиці, гуманітарних та природничих науках, GPT-5 Pro набрала 42%. Grok 4 Heavy показав вищий результат — 44,4%.
Ілон Маск не втримався від тролінгу OpenAI.
Bottom line though:
Grok 4 Heavy was smarter 2 weeks ago than GPT5 is now and G4H is already a lot better.
Let that sink in. https://t.co/BrggsEwnuz
— Elon Musk (@elonmusk) August 7, 2025
«Grok 4 Heavy був розумнішим два тижні тому, ніж GPT-5 зараз, а G4H уже значно кращий», — написав мільярдер.
У тесті GPQA Diamond, що містить наукові питання рівня докторантури, GPT-5 Pro набрала 89,4% з першої спроби, перевершивши Claude Opus 4.1 (80,9%) та Grok 4 Heavy (88,9%).
OpenAI стверджує, що GPT-5 краще працює з темами охорони здоров’я. У HealthBench Hard Hallucinations, який вимірює точність відповідей у сфері медицини, GPT-5 вигадує дані у 1,6% випадків. Це значно менше, ніж у GPT-4o (12,9%) та o3 (15,8%).
Загалом нова модель «галюцинує» лише у 4,8% відповідей, що набагато нижче, ніж у o3 та GPT-4o — 22% і 20,6% відповідно.
У Tau-bench, який перевіряє здатність ШІ виконувати симульовані онлайн-завдання, GPT-5 показала змішані результати: 63,5% у сценарії з авіакомпанією (проти 64,8% у o3) та 81,1% у завданні з ритейлерами (проти 82,4% у Claude Opus 4.1).
OpenAI підкреслює підвищену безпеку GPT-5: вона рідше видає хибні відповіді та краще виявляє зловмисників.
Оновлення
Разом із релізом GPT-5 у ChatGPT з’явилася функція кастомізації, що дозволяє налаштувати стиль спілкування чат-бота. Користувачі можуть обрати один із типів особистості: цинік, робот, слухач або ботан. Ці параметри автоматично впливають на формулювання відповідей, усуваючи потребу задавати тон щоразу вручну.
Серед інших нововведень:
- покращений голосовий режим — більш природний і «розумний»;
- можливість зміни кольору чатів;
- інтеграція зі сторонніми сервісами, зокрема Gmail та Google Calendar, для більш релевантних відповідей.
Нагадаємо, у серпні OpenAI випустила міркувальні ШІ-моделі з відкритим кодом, які демонструють високі результати в низці бенчмарків і доступні для завантаження на Hugging Face.