Anthropic запустила динамічні робочі процеси в Claude Code

Компанія Anthropic випустила Claude Opus 4.8 і представила функцію динамічних робочих процесів для Claude Code.

Інструмент дозволяє ШІ самостійно писати оркестраційні скрипти, запускати десятки чи сотні паралельних субагентів і перевіряти результати.

Рішення розраховане на складні завдання у великих кодових базах: аудит безпеки, пошук помилок, міграцію між фреймворками та мовами програмування, модернізацію проєктів.

Функція доступна в режимі попереднього тестування в інтерфейсі командного рядка Claude Code, настільній версії та розширенні для VS Code, через API, а також в Amazon Bedrock, Vertex AI і Microsoft Foundry.

Запустити режим можна прямою командою на створення робочого процесу або через ultracode. Він підвищує рівень обчислювальних зусиль до максимального і дозволяє моделі самостійно вирішувати, коли задіяти багатоетапну схему.

В Anthropic попередили: динамічні робочі процеси споживають суттєво більше токенів, ніж стандартна сесія Claude Code.

Модель розбиває задачу на підзадачі, розподіляє їх між паралельними агентами, а потім об’єднує висновки після взаємної перевірки та спроб спростувати знайдені рішення.

Як приклад Anthropic навела перенесення Bun з мови програмування Zig на Rust. Розробник Джаред Самнер використав динамічні робочі процеси для генерації близько 750 000 рядків Rust-коду. Порт пройшов 99,8% чинного набору тестів, а шлях від першого коміту до злиття тривав 11 днів. Втім в Anthropic уточнили, що версія поки не використовується у продакшені.

Показники нової моделі Opus 4.8:

  • 69,2% у SWE-Bench Pro;
  • 49,8% у Humanity’s Last Exam без інструментів і 57,9% з ними;
  • 83,4% в OSWorld-Verified;
  • 1890 балів у GDPval-AA;
  • 53,9% у Finance Agent v2.

У Terminal-Bench 2.1 Opus 4.8 поступилася GPT-5.5 — 74,6% проти 78,2%.

В Anthropic заявили, що Opus 4.8 стала помітно «чеснішою» під час виконання агентних завдань: модель частіше вказує на невизначеність, рідше заявляє про непідтверджений прогрес і краще помічає проблеми у власному коді до передачі результату користувачу.

Нагадаємо, у травні Anthropic опублікувала перший звіт щодо Project Glasswing — програми пошуку вразливостей за допомогою моделі Claude Mythos.

Читайте ForkLog UA в соціальних мережах

Знайшли помилку в тексті? Виділіть її та натисніть CTRL+ENTER

Матеріали за темою

Ми використовуємо файли cookie для покращення якості роботи.

Користуючись сайтом, ви погоджуєтесь з Політикою приватності.

OK
Exit mobile version