ШІ-моделі «зламали» смартконтракти на $550,1 млн

Компанія Anthropic застосувала ШІ-моделі для пошуку вразливостей у смартконтрактах і виявила вектори для атак на загальну суму $550,1 млн.

Дослідники MATS і Anthropic Fellows створили новий бенчмарк Smart CONtracts Exploitation benchmark (SCONE-bench) — він охоплює 405 контрактів, зламаних у період з 2020 по 2025 роки.

Експерти оцінили 10 моделей, які сукупно згенерували робочі експлойти для 207 протоколів (51,11%) і змогли «викрасти» кошти на $550,1 млн.

Окремо для контрактів, зламаних після березня 2025 року (останньої дати оновлення знань нейромереж), ШІ-моделі змогли відтворити експлойти на $4,6 млн. Це визначило нижню межу конкретних економічних збитків від LLM.

Далі експерти оцінили Sonnet 4.5 і GPT-5 у симуляції на 2849 нещодавно розгорнутих протоколах без відомих лазівок для крадіжки. Обидва агенти виявили дві нові вразливості нульового дня і створили робочі експлойти на $3694. ШІ від OpenAI витратив на запити до API $3476.

Сукупний дохід від використання вразливостей після 1 березня 2025 року. Джерело: Anthropic.

«Результати показують, що прибуткова автономна експлуатація вразливостей у реальних умовах технічно можлива. І підкреслюють, наскільки важливо заздалегідь впроваджувати ШІ для захисту», — йдеться в блозі Anthropic.

Команда наголосила, що всі тести проводилися в симуляторах блокчейна без завдання реальної шкоди.

Фінансова складова

В Anthropic звернули увагу, що нині вже існують тести на кшталт CyberGym і Cybench для оцінки можливостей здійснювати складні кібератаки та шпигунство на державному рівні. Втім, вони пропускають важливий аспект: фінансові наслідки зламу.

«Порівняно з довільними показниками успішності, кількісна оцінка можливостей у грошовому вимірі корисніша для розуміння та інформування політиків, розробників і громадськості про ризики», — йдеться в блозі.

Тому експерти звернулися до смартконтрактів у блокчейнах.

«Увесь їхній вихідний код і логіка транзакцій — перекази, торги, позики — є загальнодоступними й обробляються виключно ПЗ без участі людини. У підсумку вразливості можуть призвести до прямої крадіжки, а ми можемо виміряти вартість інцидентів у доларах», — зазначили в Anthropic.

SCONE-bench

SCONE-bench — перший бенчмарк, що оцінює здатність агентів експлуатувати смартконтракти й вимірює атаки в доларах.

Для кожного протоколу ШІ пропонується визначити вразливість і створити скрипт для зламу.

SCONE-bench містить:

  • 405 смартконтрактів із реальними вразливостями, які піддавалися атакам у період з 2020 по 2025 рік в Ethereum, BNB Smart Chain і Base;
  • базового агента, який працює в кожному ізольованому середовищі та намагається використати вразливість протягом 60 хвилин за допомогою інструментів, доступних через Model Context Protocol;
  • систему оцінювання;
  • можливість для розробників перевірити власні смартконтракти перед їх розгортанням.

Нагадаємо, у листопаді в Anthropic представили Claude Opus 4.5 — «найкращу у світі модель для програмування, агентів і використання комп’ютера».

Читайте ForkLog UA в соціальних мережах

Знайшли помилку в тексті? Виділіть її та натисніть CTRL+ENTER

Матеріали за темою

Ми використовуємо файли cookie для покращення якості роботи.

Користуючись сайтом, ви погоджуєтесь з Політикою приватності.

OK
Exit mobile version