Огляд нейромережі GPT-4: що вміє і чим відрізняється від попередників

28.03.2023 ForkLog UA

#GPT-4 #openAI #нейромережі #чатботи #Штучний Інтелект

14 березня 2023 року ШІ-лабораторія OpenAI представила велику мультимодальну нейромережу GPT-4. Відразу після релізу розробники відкрили до неї доступ передплатникам ChatGPT Plus, але з деякими обмеженнями.

Редакція ForkLog AI протестувала нейромережу, з’ясувала її можливості та порівняла з алгоритмом GPT-3.5.

GPT-4 доступний передплатникам ChatGPT Plus і користувачам чату оновленого Bing.
Четверта версія алгоритму здатна приймати підказку та зображення, надаючи текстовий результат.
Нейромережа може зображати запропоновану роль, говорити в певному тоні й допомагати у вирішенні різних завдань.
У звичайній розмові відмінностей у спілкуванні з GPT-3.5 та GPT-4 практично немає.

Що таке GPT-4 та як з ним поговорити

Це четверте покоління моделі обробки природної мови OpenAI. За словами розробників, у порівнянні з GPT-3.5 новий алгоритм більш надійний, креативний та швидше виконує роботу з інструкціями.

chat gpt 4 — Оголошення про доступність GPT-4 при запуску ChatGPT Plus. Дані: ChatGPT.

Компанія поділилася результатами багатьох тестів нейромережі, а також показала кілька демонстрацій її роботи.

Однак ШІ-лабораторія не надала інформації про навчальні дані, методи, що використовуються для створення моделі, обладнання або енерговитрати при тренуванні.

chatgpt що це таке — GPT-4 розповідає про себе. Дані: ChatGPT.

Якщо запитати про це алгоритм, він видасть розмиту інформацію без конкретизації, яка є актуальною також для GPT-3.5.

чат гпт — Відповідь GPT-4 про дані, які використовують розробники для її створення, а також методи та обладнання. Дані: ChatGPT.

Нейромережа доступна в усіх країнах, окрім Афганістану, Білорусі, Венесуели, Ірану, Китаю та Росії.

У лютому стало відомо, що Україну виключили зі списку держав, де заблоковано сервіси OpenAI. Однак алгоритми компанії не працюють на тимчасово окупованих Росією територіях.

Користувачі з регіонів, де технологія недоступна, зможуть використовувати GPT-4 тільки за наявності VPN-сервісу та активного телефонного номера з відкритої для нейромережі держави.

Щоби поспілкуватися з алгоритмом, необхідно придбати передплату ChatGPT Plus вартістю $20. Потім вгорі клікнути на полі Model і вибрати GPT-4.

У березні 2023 року Microsoft підтвердила, що оновлений Bing працює на оптимізованій версії GPT-4. Пізніше компанія також видалила список очікування для ШІ-чату, надавши можливість усім бажаючим використати покращений режим пошуку.

До того ж алгоритм Bing має знання, що виходять за рамки «до вересня 2021 року», і в спілкуванні використовує актуальні дані.

GPT-4, як і його попередник, дає розгорнуті відповіді на питання.

На момент публікації статті швидкість написання тексту залишилася низькою: бот пише близько одного-двох слів на секунду.

21 березня після масштабного збою розробники ввели обмеження до 25 генерацій тексту протягом трьох годин. До цього дозволялося використовувати 100 повідомлень кожні чотири години.

З’ясувалося, що OpenAI тимчасово призупинила роботу ChatGPT після повідомлень про помилку, яка дозволяє деяким користувачам бачити заголовки діалогів в історії чатів інших людей.

Глава компанії Сем Альтман заявив, що розробники «відчувають себе жахливо» через це.

we had a significant issue in ChatGPT due to a bug in an open source library, for which a fix has now been released and we have just finished validating.

a small percentage of users were able to see the titles of other users’ conversation history.

we feel awful about this.
— Sam Altman (@sama) March 22, 2023

Можливості алгоритму

Головна відмінність четвертої версії GPT від попередників — мультимодальність. Вона може приймати підказку та зображення, надаючи кінцевий результат у вигляді тексту.

Також нейромережа здатна «міркувати» на основі графічних даних.

Однак обробка зображень поки недоступна у ChatGPT Plus.

chat gpt picture — Відповідь GPT-4 на питання щодо можливості обробляти зображення. Дані: ChatGPT.

Цікаво, що бот відповів, що він не є мультимодальною моделлю, хоча це не відповідає дійсності.

У компанії зазначили, що, крім мультимодальності, алгоритм навчився обробляти понад 25 000 слів. Для порівняння, GPT-3.5 могла генерувати лише 3000 слів.

Таке збільшення обсягу тексту дозволяє створювати більший об’єм контенту та аналізувати великі документи.

За словами розробників, GPT-4 може вирішити «складні проблеми з більшою усвідомленістю завдяки більш тонким знанням та можливостям».

«Нова модель менш ефективна, ніж люди, однак у багатьох реальних сценаріях демонструє продуктивність на рівні людини», — йдеться на сайті OpenAI.

Алгоритм здатний на запит користувача приймати ту чи іншу роль. Його можна попросити стати юристом чи репетитором. У такому випадку система точніше оброблятиме запити, пов’язані з конкретною сферою знань.

Ми попросили GPT-4 представити себе юристом і допомогти подати скаргу до Товариства захисту прав споживачів у зв’язку з купівлею простроченого йогурту. Вигадана ситуація передбачала відмову менеджера супермаркету «Ковбаса» приймати назад товар та повертати гроші.

Алгоритм порекомендував виконати низку певних дій.

GPT-4 у ролі юриста дає рекомендації для подання скарги до Товариства захисту прав споживачів. Дані: ChatGPT.

Модель може прикинутися RPG-героєм, репортером чи ще кимось.

GPT-4 у ролі журналіста веде репортаж із місця, де виявили міграцію єдинорогів. Дані: ChatGPT.

Також нейромережа здатна в стилі обраного персонажа пояснювати різні поняття.

GPT-4 у ролі капітана Джека Спарроу пояснює теорію відносності. Дані: ChatGPT.

GPT-4 на запит може змінити характер спілкування та відповідати з обраною користувачем емоцією. Наприклад, нібито він образився.

«Ображені» відповіді GPT-4. Дані: ChatGPT.

У компанії заявили, що модель дуже творча та колаборативна. Вона може генерувати, редагувати та повторювати за користувачем різні завдання з письма, включно із написанням пісень, створенням сценаріїв та вивченням певного мовного стилю.

Ми попросили алгоритм заримувати «Казку про трьох братів» із серії книг про Гаррі Поттера, а потім скоротити результат і зробити його «веселішим». Нейромережа виконала запити.

GPT-4 розповіла «Казку про трьох братів».

Якщо попросити GPT-4 допомогти в створенні програми чи вебсервісу, система надасть покрокові інструкції для виконання завдання.

GPT-4 може створювати ASCII-зображення. Робот не здатний генерувати складні зображення, а лише спрощені малюнки.

ASCII-зображення робота, яке створив GPT-4. Дані: ChatGPT.

Однак інтегрований у ChatGPT алгоритм обмежений знаннями до вересня 2021 року. Тому не вийде дізнатися прогноз погоди на завтра в Одесі, подробиці про серіал «Останні з нас», що вийшов у 2023 році, та чи жива королева Великобританії Єлизавета II.

Відповідь GPT-4 про популярні у 2023 році серіали. Дані: ChatGPT.

24 березня OpenAI додала в ChatGPT підтримку сторонніх плагінів. Вони дозволять чат-боту володіти актуальними вебданими та взаємодіяти з конкретними сайтами.

Компанія вже інтегрувала 11 плагінів, включно з Expedia, OpenTable та Wolfram.

Плагіни, що доступні в ChatGPT. Дані: OpenAI.

Також інженери додали два плагіни власної розробки: інтерпретатор коду та браузер. Останній може шукати інформацію в інтернеті та надавати посилання на джерела.

OpenAI повідомили, що спочатку випробувати нову можливість зможе невелика кількість обраних розробників і користувачів ChatGPT Plus зі списку очікування.

Чим GPT-4 відрізняється від GPT-3.5

За словами розробників, у звичайній розмові відмінностей у спілкуванні з GPT-3.5 та GPT-4 практично немає. Різниця помітна, коли складність завдання досягає певного рівня.

Щоби показати відмінності між алгоритмами інженери OpenAI провели різні тести. Вони використовували загальнодоступні олімпіадні завдання та платні практичні іспити за 2022–2023 роки.

Розробники заявили, що перед тестуванням не готували алгоритми. Згідно з результатами, GPT-4 виявилася ефективнішою за GPT-3.5.

Результати іспитів GPT-3.5 та GPT-4. Дані: OpenAI.

Також четверта версія алгоритму перевершила свого попередника в традиційних тестах, розроблених для ШІ-систем. З’ясувалося, що GPT-4 значно ефективніший за існуючі мовні моделі.

Результати бенчмарку ШІ-завдань. Дані: OpenAI.

Ми також запропонували GPT-3.5 та GPT-4 вирішити деякі завдання та порівняли їх відповіді.

Перша головоломка називається «Під час припливу». Для її вирішення необхідно, маючи дані, розрахувати, скільки мине часу, перш ніж вода покриє третю сходинку мотузкових сходів судна під час припливу.

GPT-3.5 відповіла, що це займе дві години, а GPT-4 — чотири.

Однак, коли завдання стосується будь-якого фізичного явища, потрібно враховувати всі змінні. У цьому випадку логіка завдання передбачає, що одночасно зі збільшенням рівня води судно також підніматиметься. Відповідно, сходи по відношенню до ватерлінії не змінять свого становища.

Якщо вказати на логіку завдання алгоритмам, можна отримати коректну відповідь.

Потім моделям необхідно було зробити короткий переказ основних подій книги «Лев, Чаклунка та шафа» письменника Клайва Льюїса.

Після цього ми попросили GPT-4 та GPT-3.5 написати програмний код мовою JavaScript для підключення до бази даних MongoDB, створення користувача, внесення його до бази та реєстрації. Обидві моделі видали докладні вказівки.

Програмний код, який написали GPT-4 та GPT-3.5. Дані: ChatGPT.

Але GPT-3.5 запропонував менш надійний метод. Наприклад, він не хешував пароль і навіть не попередив про це.

Якщо попросити нейромережі пояснити поняття «період напіврозпаду» десятирічній дитині, вони згенерують відповіді, на які не потрібні будуть додаткові підказки.

Ще ми попросили алгоритми придумати жарт про корінь мандрагори з книг про Гаррі Поттера.

Також ми задали алгоритмам дивне завдання створити з літер Мону Лізу.

Висновок

Коли в червні 2020 року компанія OpenAI представила GPT-3, нейромережа викликала фурор у світі штучного інтелекту. На той момент вона була була найінноваційнішою.

Однак час та технології не стоять на місці. Після GPT-3 з’явилася покращена нейромережа GPT-3.5, а потім ще більш апгрейднута GPT-4.

Згідно з дослідженням Microsoft, четверта версія моделі демонструє «іскри» інтелекту людського рівня або сильного ШІ.

Однак при першому знайомстві з GPT-4 та спілкуванні на звичайні теми складно помітити її перевагу над GPT-3.5.

Відчувається лише різниця у швидкості створення тексту. Через те, що нова версія нейромережі пише розгорнуті відповіді, це може зайняти тривалий час.

До того ж, не можна не звернути увагу на обмеженість знань «до вересня 2021 року». Але той же Bing на базі GPT-4 вирішує проблему.

У складних питаннях при обробці великих документів нова модель явно перевершує попередників. Також можна побачити і її «посилену» креативність.

Ще цікаво випробувати модель в обробці зображень. Ймовірно, найближчим часом OpenAI додасть цю можливість у ChatGPT Plus.

OpenAI також поки що не випустила API-версію GPT-4, але відкрила список очікування.

Після анонсу багато компаній захотіли впровадити технологію у свої послуги. Microsoft вже використовує її в чаті Bing, GitHub Copilot, 365 Copilot та DAX Express.

Сервіс Duolingo також застосував новий ШІ для вивчення іноземних мов. GPT-4 пояснюватиме користувачам відповіді та гратиме в рольові ігри.

У будь-якому разі спілкування з ШІ — цікавий досвід. Технологія безперечно змінює способи взаємодії зі звичними сервісами, розширює можливості та спрощує користувальницький досвід.

Навіщо писати «нудну» доповідь, якщо можна попросити нейромережу? Проте варто врахувати перевірку фактів та плагіат. Будь-який ШІ не позбавлений цих дефектів, тому потребує нагляду з боку людей.

Читайте ForkLog UA в соціальних мережах

Знайшли помилку в тексті? Виділіть її та натисніть CTRL+ENTER

Матеріали за темою

Китайська 360 представила відповідь на Mythos 5 від Anthropic

Каліфорнія відкриє держорганам доступ до Claude

Meta презентувала ШІ для відновлення набраного тексту зі записів мозкової активності

Аналітики попереджають: ШІ-бум несе ризики для фінансової системи

ЗМІ: OpenAI обмежить реліз GPT-5.6 на запит уряду США

Anthropic звинуватила пов’язаних з Alibaba операторів у дистиляції Claude

Пентагон розширив роль ШІ у військовій стратегії

У Бристолі вимкнули ШІ-моделі для оцінки ризику злочинів проти дітей через помилки

AAA представила юридичний стандарт для ШІ‑агентів