Claude перевершив людей у керуванні робопсом
Компанія Anthropic оновила експеримент Project Fetch. Модель Claude Opus 4.7 виконала завдання з налаштування та керування робопсом у 20 разів швидше, ніж команди інженерів-людей.
Новий допис блогу Frontier Red Team: фаза 2 Project Fetch, де ми перевіряємо, наскільки добре Claude може програмувати робопса.
Opus 4.7 самостійно був приблизно у 20 разів швидшим, ніж торішня найкраща команда людей, якій допомагав Opus 4.1. (Робопес, на жаль, усе ще не зміг принести пляжний м’яч.)https://t.co/CgbBtRf85e
— Anthropic (@AnthropicAI) June 18, 2026
У серпні 2024 року співробітники компанії без досвіду в робототехніці намагалися запрограмувати чотириногого робота. Тоді ШІ лише допомагав людям швидше знаходити рішення. У новій фазі тестування модель Claude Opus 4.7 працювала майже автономно під мінімальним наглядом дослідника. Нейромережа самостійно:
- підключилася до датчиків відео та лідара;
- написала програму для ручного керування;
- створила систему моніторингу шляху робота;
- налаштувала алгоритм розпізнавання предметів.
Opus 4.7 виявилася у 18 разів швидшою за команду, що користувалася старими версіями ШІ, і у 37 разів швидшою за людей без допомоги чатбота. Нейромережа писала ефективніший код: його обсяг виявився у 10 разів меншим, ніж у людських команд.
Автори зазначили, що прогрес у робототехніці став побічним ефектом загального масштабування мовних моделей. Anthropic не впроваджувала спеціалізовані алгоритми для керування «залізом».
Попри успіх, Claude все ще має труднощі з точними фізичними діями. Модель змогла довести робота до цілі, але не впоралася із завданням акуратно підштовхнути м’яч у потрібну точку. Це вимагає складного зворотного зв’язку в реальному часі, у якому люди поки перевершують ШІ.
В Anthropic вважають, що індустрія входить в еру «фізичних ШІ-агентів». У майбутньому нейромережі зможуть користуватися стандартними інструментами та обладнанням так само ефективно, як зараз працюють із програмним кодом.
Нагадаємо, 13 червня Anthropic призупинила доступ до моделей Fable 5 і Mythos 5. За даними Semafor, причиною стала директива уряду США в межах експортного контролю.