OpenAI випустила флагманську ШІ-модель GPT-5

08.08.2025 ForkLog UA

Компанія OpenAI запустила нову флагманську ШІ-модель, яка стане основою наступного покоління ChatGPT.

GPT-5 is here.

Rolling out to everyone starting today.https://t.co/rOcZ8J2btI pic.twitter.com/dk6zLTe04s

— OpenAI (@OpenAI) August 7, 2025

GPT-5 — перша «уніфікована» нейромережа, що поєднує режим послідовних міркувань і швидких відповідей у стилі GPT. Спеціальний маршрутизатор визначає, який підхід застосувати для виконання завдання: дати швидку відповідь або витратити більше часу на обдумування, щоб підвищити якість результату.

GPT-4 дозволяв чат-боту відповідати на широкий спектр запитань. GPT-5 уже здатна виконувати завдання від імені користувача, зокрема створювати програмні застосунки, працювати з календарем або формувати дослідницькі звіти.

OpenAI випустила флагманську ШІ-модель GPT-5 — Джерело: OpenAI.

CEO стартапу Сем Альтман назвав GPT-5 «найкращою моделлю у світі» та «значним кроком» до створення загального штучного інтелекту, здатного перевершити людину в найбільш економічно цінній роботі.

GPT-5 доступна безкоштовним користувачам із певними лімітами, для власників Plus і Pro вони збільшені.

Через API пропонуються три моделі: GPT-5, GPT-5 mini, GPT-5 nano.

Ціни на токени GPT-5 — Ціни на вхідні та вихідні токени GPT-5. Джерело: X.

Бенчмарки

OpenAI позиціонує GPT-5 як передову в кількох напрямах. За низкою показників вона випереджає розробки Anthropic, Google DeepMind та xAI, хоча в окремих сферах поступається конкурентам.

Серед сильних сторін нової моделі — програмування. У тесті SWE-bench Verified вона набрала 74,9% з першої спроби, обійшовши Claude Opus 4.1 (74,5%) і Gemini 2.5 Pro (59,6%).

В одному з прикладів GPT-5 створила інтерактивний матеріал для пояснення складних концепцій, зокрема ефекту Бернуллі, згенерувавши сотні рядків коду за кілька хвилин.

demo time:

GPT-5 can make something interactive to explain complex concepts like the bernoulli effect to you, churning out hundreds of lines of code in a couple of minutes. pic.twitter.com/cIU7O608TT

— Sam Altman (@sama) August 7, 2025

В іншому випадку модель створила вебзастосунок для вивчення французької мови.

У тесті Humanity’s Last Exam, що оцінює роботу ШІ в математиці, гуманітарних та природничих науках, GPT-5 Pro набрала 42%. Grok 4 Heavy показав вищий результат — 44,4%.

Ілон Маск не втримався від тролінгу OpenAI.

Bottom line though:

Grok 4 Heavy was smarter 2 weeks ago than GPT5 is now and G4H is already a lot better.

Let that sink in. https://t.co/BrggsEwnuz

— Elon Musk (@elonmusk) August 7, 2025

«Grok 4 Heavy був розумнішим два тижні тому, ніж GPT-5 зараз, а G4H уже значно кращий», — написав мільярдер.

У тесті GPQA Diamond, що містить наукові питання рівня докторантури, GPT-5 Pro набрала 89,4% з першої спроби, перевершивши Claude Opus 4.1 (80,9%) та Grok 4 Heavy (88,9%).

OpenAI стверджує, що GPT-5 краще працює з темами охорони здоров’я. У HealthBench Hard Hallucinations, який вимірює точність відповідей у сфері медицини, GPT-5 вигадує дані у 1,6% випадків. Це значно менше, ніж у GPT-4o (12,9%) та o3 (15,8%).

Загалом нова модель «галюцинує» лише у 4,8% відповідей, що набагато нижче, ніж у o3 та GPT-4o — 22% і 20,6% відповідно.

У Tau-bench, який перевіряє здатність ШІ виконувати симульовані онлайн-завдання, GPT-5 показала змішані результати: 63,5% у сценарії з авіакомпанією (проти 64,8% у o3) та 81,1% у завданні з ритейлерами (проти 82,4% у Claude Opus 4.1).

OpenAI підкреслює підвищену безпеку GPT-5: вона рідше видає хибні відповіді та краще виявляє зловмисників.

Оновлення

Разом із релізом GPT-5 у ChatGPT з’явилася функція кастомізації, що дозволяє налаштувати стиль спілкування чат-бота. Користувачі можуть обрати один із типів особистості: цинік, робот, слухач або ботан. Ці параметри автоматично впливають на формулювання відповідей, усуваючи потребу задавати тон щоразу вручну.

Серед інших нововведень:

покращений голосовий режим — більш природний і «розумний»;
можливість зміни кольору чатів;
інтеграція зі сторонніми сервісами, зокрема Gmail та Google Calendar, для більш релевантних відповідей.

Нагадаємо, у серпні OpenAI випустила міркувальні ШІ-моделі з відкритим кодом, які демонструють високі результати в низці бенчмарків і доступні для завантаження на Hugging Face.

Читайте ForkLog UA в соціальних мережах

Знайшли помилку в тексті? Виділіть її та натисніть CTRL+ENTER

Матеріали за темою

Китайська 360 представила відповідь на Mythos 5 від Anthropic

Каліфорнія відкриє держорганам доступ до Claude

Meta презентувала ШІ для відновлення набраного тексту зі записів мозкової активності

Аналітики попереджають: ШІ-бум несе ризики для фінансової системи

ЗМІ: OpenAI обмежить реліз GPT-5.6 на запит уряду США

Anthropic звинуватила пов’язаних з Alibaba операторів у дистиляції Claude

Пентагон розширив роль ШІ у військовій стратегії

У Бристолі вимкнули ШІ-моделі для оцінки ризику злочинів проти дітей через помилки

AAA представила юридичний стандарт для ШІ‑агентів