OpenAI випустила флагманську ШІ-модель GPT-5

Компанія OpenAI запустила нову флагманську ШІ-модель, яка стане основою наступного покоління ChatGPT.

GPT-5 — перша «уніфікована» нейромережа, що поєднує режим послідовних міркувань і швидких відповідей у стилі GPT. Спеціальний маршрутизатор визначає, який підхід застосувати для виконання завдання: дати швидку відповідь або витратити більше часу на обдумування, щоб підвищити якість результату.

GPT-4 дозволяв чат-боту відповідати на широкий спектр запитань. GPT-5 уже здатна виконувати завдання від імені користувача, зокрема створювати програмні застосунки, працювати з календарем або формувати дослідницькі звіти.

OpenAI випустила флагманську ШІ-модель GPT-5
Джерело: OpenAI.

CEO стартапу Сем Альтман назвав GPT-5 «найкращою моделлю у світі» та «значним кроком» до створення загального штучного інтелекту, здатного перевершити людину в найбільш економічно цінній роботі.

GPT-5 доступна безкоштовним користувачам із певними лімітами, для власників Plus і Pro вони збільшені.

Через API пропонуються три моделі: GPT-5, GPT-5 mini, GPT-5 nano.

Ціни на токени GPT-5
Ціни на вхідні та вихідні токени GPT-5. Джерело: X.

Бенчмарки

OpenAI позиціонує GPT-5 як передову в кількох напрямах. За низкою показників вона випереджає розробки Anthropic, Google DeepMind та xAI, хоча в окремих сферах поступається конкурентам.

Серед сильних сторін нової моделі — програмування. У тесті SWE-bench Verified вона набрала 74,9% з першої спроби, обійшовши Claude Opus 4.1 (74,5%) і Gemini 2.5 Pro (59,6%).

В одному з прикладів GPT-5 створила інтерактивний матеріал для пояснення складних концепцій, зокрема ефекту Бернуллі, згенерувавши сотні рядків коду за кілька хвилин.

В іншому випадку модель створила вебзастосунок для вивчення французької мови.

У тесті Humanity’s Last Exam, що оцінює роботу ШІ в математиці, гуманітарних та природничих науках, GPT-5 Pro набрала 42%. Grok 4 Heavy показав вищий результат — 44,4%.

Бенчмарки GPT-5
Джерело: OpenAI.

Ілон Маск не втримався від тролінгу OpenAI.

«Grok 4 Heavy був розумнішим два тижні тому, ніж GPT-5 зараз, а G4H уже значно кращий», — написав мільярдер.

У тесті GPQA Diamond, що містить наукові питання рівня докторантури, GPT-5 Pro набрала 89,4% з першої спроби, перевершивши Claude Opus 4.1 (80,9%) та Grok 4 Heavy (88,9%).

OpenAI стверджує, що GPT-5 краще працює з темами охорони здоров’я. У HealthBench Hard Hallucinations, який вимірює точність відповідей у сфері медицини, GPT-5 вигадує дані у 1,6% випадків. Це значно менше, ніж у GPT-4o (12,9%) та o3 (15,8%).

Загалом нова модель «галюцинує» лише у 4,8% відповідей, що набагато нижче, ніж у o3 та GPT-4o — 22% і 20,6% відповідно.

У Tau-bench, який перевіряє здатність ШІ виконувати симульовані онлайн-завдання, GPT-5 показала змішані результати: 63,5% у сценарії з авіакомпанією (проти 64,8% у o3) та 81,1% у завданні з ритейлерами (проти 82,4% у Claude Opus 4.1).

OpenAI підкреслює підвищену безпеку GPT-5: вона рідше видає хибні відповіді та краще виявляє зловмисників.

Оновлення

Разом із релізом GPT-5 у ChatGPT з’явилася функція кастомізації, що дозволяє налаштувати стиль спілкування чат-бота. Користувачі можуть обрати один із типів особистості: цинік, робот, слухач або ботан. Ці параметри автоматично впливають на формулювання відповідей, усуваючи потребу задавати тон щоразу вручну.

Серед інших нововведень:

  • покращений голосовий режим — більш природний і «розумний»;
  • можливість зміни кольору чатів;
  • інтеграція зі сторонніми сервісами, зокрема Gmail та Google Calendar, для більш релевантних відповідей.

Нагадаємо, у серпні OpenAI випустила міркувальні ШІ-моделі з відкритим кодом, які демонструють високі результати в низці бенчмарків і доступні для завантаження на Hugging Face.

Читайте ForkLog UA в соціальних мережах

Знайшли помилку в тексті? Виділіть її та натисніть CTRL+ENTER

Матеріали за темою

Ми використовуємо файли cookie для покращення якості роботи.

Користуючись сайтом, ви погоджуєтесь з Політикою приватності.

OK