ChatGPT навчився виконувати завдання замість людини

18.07.2025 ForkLog UA

#openAI #чатботи #ШІ-Агенти #Штучний Інтелект

OpenAI презентувала нового універсального ШІ-агента в ChatGPT, здатного самостійно виконувати широкий спектр комп’ютерних задач від імені користувача.

ChatGPT can now do work for you using its own computer.

Introducing ChatGPT agent—a unified agentic system combining Operator’s action-taking remote browser, deep research’s web synthesis, and ChatGPT’s conversational strengths. pic.twitter.com/7uN2Nc6nBQ

— OpenAI (@OpenAI) July 17, 2025

За словами компанії, агент може автоматично керувати календарем, створювати редаговані презентації та слайди, а також запускати код.

ChatGPT agent поєднує функціонал кількох попередніх агентних систем: здатність Operator кліком взаємодіяти з вебсайтами, можливості Deep Research зі збору інформації з десятків джерел і створення стислих аналітичних звітів.

Керування агентом відбувається в діалозі звичайною мовою. Початково інструмент доступний користувачам з підписками Pro, Plus і Team. Для активації потрібно вибрати «режим агента» (agent mode) у меню ChatGPT.

Новий агент підтримує ChatGPT connectors — інтеграцію з Gmail, GitHub та іншими застосунками для виконання запитів. Також він має доступ до терміналу та вміє працювати з API.

Сценарії використання вже включають планування і покупку інгредієнтів для японського сніданку на чотирьох, аналіз конкурентів і створення презентації на основі результатів.

Тестування

Модель, що лежить в основі агента, показує передові результати у низці бенчмарків. У тесті Humanity’s Last Exam — одному з найскладніших, що включає тисячі питань з понад 100 дисциплін, — ChatGPT agent набрав 41,6%, що вдвічі перевищує результати моделей o3 і o4-mini.

ChatGPT научился выполнять задачи вместо человека — Порівняння моделей у Humanity’s Last Exam. Джерело: OpenAI.

У складному математичному бенчмарку FrontierMath агент досяг результату 27,4%. Попередній рекорд належав o4-mini — 6,3%.

Безпека

OpenAI наголосила на важливості безпеки нового агента через його потужний функціонал, що потенційно може бути використаний зловмисниками.

У системному звіті зазначено, що модель має «високу здатність» у сфері біологічної та хімічної зброї, тобто теоретично здатна посилити наявні шляхи завдання шкоди. Прямих доказів загрози немає, але компанія вживає запобіжних заходів:

онлайн-моніторинг — усі запити користувача проходять через класифікатор, який визначає, чи пов’язані вони з біологічною тематикою. Якщо так — відповідь перевіряється ще раз на потенційну загрозу;
відключена функція памʼяті — для запобігання витоку даних через шкідливі інʼєкції у промптах.

Нагадаємо, у липні стало відомо, що OpenAI посилила безпеку систем на тлі загроз корпоративного шпигунства з боку китайських конкурентів.

Читайте ForkLog UA в соціальних мережах

Знайшли помилку в тексті? Виділіть її та натисніть CTRL+ENTER

Матеріали за темою

AWS випустила ШІ-чип Trainium3

В Mistral випустили нову лінійку ШІ‑моделей

Nvidia представила ШІ-модель для автономного керування авто

Нова відеомодель Runway обійшла Veo 3 і Sora 2 Pro

ШІ-моделі «зламали» смартконтракти на $550,1 млн

Google та Anthropic похитнули домінування OpenAI в ШІ-перегонах

Україна створить суверенний ШІ на базі моделі Google Gemma

Випускник середньої школи опанував LLM за допомогою ChatGPT і влаштувався в OpenAI

Експерти попередили про ризики дитячих іграшок з ШІ