OpenAI представила GPT‑5.5‑Cyber на тлі обмежень Anthropic
22 червня OpenAI запустила повну версію GPT‑5.5‑Cyber — спеціалізованої моделі для пошуку, перевірки й виправлення вразливостей. Реліз відбувся на тлі обмежень довкола Anthropic.
Відповідно до заяви, GPT‑5.5‑Cyber входить до програми Daybreak і не буде доступна масовому користувачеві. Модель розрахована на перевірених фахівців з кібербезпеки, яким потрібні посилені можливості для авторизованої оборонної роботи.
Як утворилося вікно для OpenAI
9 червня Anthropic відкрила доступ до двох версій одного сімейства моделей Claude. Fable 5 компанія описала як рішення класу Mythos, але безпечне для загального використання. Claude Mythos 5 — «приватна» базова модель з послабленими обмеженнями в окремих сферах. Втім уже 12 червня розробник відключив їх після отримання директиви уряду США в межах експортного контролю.
Рішення спричинило проблеми не лише в пересічних користувачів. 23 червня компанія Legion подала позов проти уряду США через директиву, повідомляє Reuters. Організація базується в Сан-Хосе, але її команда розробки — у Канаді. За даними агентства, у Legion заявили, що втрата доступу до моделей Anthropic порушила роботу її інструментів для підготовки юридичних документів і управління справами.
На цьому тлі OpenAI обрала інший підхід: компанія уточнила, що попередньо координувала перевірки з федеральними структурами США, а згодом відкрила GPT‑5.5‑Cyber лише для перевірених користувачів.
Що вміє GPT‑5.5‑Cyber
За даними OpenAI, GPT‑5.5‑Cyber показала 85,6% на CyberGym проти 81,8% у стандартної GPT‑5.5. Показник фокусується на відтворенні відомих вразливостей у контрольованих програмних середовищах і не охоплює весь спектр реальних атак і оборонних сценаріїв.
У блозі OpenAI також наведені результати на інших тестах. На ExploitGym модель набрала 39,5% проти 25,95% у звичайної GPT‑5.5. На SEC‑bench Pro — 69,8% проти 63,1%. Перший тест оцінює здатність перетворити відому вразливість на робочий експлойт, другий — довготривалий пошук вразливостей і створення proof‑of‑concept у складних програмних цілях.
В OpenAI наголосили, що мета Daybreak — не лише знаходити більше вразливостей, а й пришвидшувати їх виправлення. За даними компанії, з березня хмарна версія Codex Security просканувала понад 30 млн комітів у більш ніж 30 000 кодових баз, а людські рев’юери позначили понад 70 000 знахідок як виправлені.
За даними Decrypt, GPT‑5.5‑Cyber обійшла Anthropic Mythos 5 на CyberGym: 85,6% проти 83,8%. Втім за іншими публічними оцінками картина складніша. 30 квітня UK AI Security Institute повідомив, що GPT‑5.5 пройшла 32‑крокову симуляцію корпоративної атаки The Last Ones від початку до кінця у 2 з 10 спроб. Mythos Preview впорався зі сценарієм у 3 з 10 спроб.
Згодом AISI оновив дані: нова версія Mythos Preview пройшла The Last Ones у 6 з 10 спроб і вперше завершила другий сценарій Cooling Tower у 3 з 10 спроб. GPT‑5.5 в цьому оновленні пройшла The Last Ones у 3 з 10 спроб.
Як OpenAI обмежує доступ
GPT‑5.5‑Cyber не призначена для загального доступу. В OpenAI уточнили, що модель розрахована на перевірених користувачів, яким потрібні посилені кіберможливості та більш «дозвільна» поведінка моделі в авторизованих сценаріях. Для більшості клієнтів компанія й надалі рекомендує GPT‑5.5 із Trusted Access for Cyber і Codex Security.
OpenAI також запустила Daybreak Cyber Partner Program. У власному блозі компанія серед учасників вказала Akamai, Check Point, Cisco, CrowdStrike, IBM, Palo Alto Networks, Proofpoint, SentinelOne, Wiz, Zscaler та інші компанії у сфері безпеки.
Ще один напрям — Patch the Planet, ініціатива для open‑source‑проєктів. Програму створено разом із Trail of Bits за участі HackerOne, Calif, дослідників і мейнтейнерів. Серед перших учасників — cURL, Go, Python, Sigstore та pyca/cryptography.
Нагадаємо, кібервідомства США, Великої Британії, Канади, Австралії та Нової Зеландії заявили, що передові моделі ШІ можуть змінити наступальні й оборонні можливості в кіберпросторі впродовж місяців, а не років. На думку авторів звіту, штучний інтелект знижує поріг входу для зловмисників, прискорює атаки й скорочує вікно між виявленням вразливості та її експлуатацією.