Fable 5 і Mythos 5: деталі та бенчмарки нових моделей Claude від Anthropic

9 червня Anthropic випустила дві версії одного сімейства моделей Claude. Fable 5 компанія описує як рішення класу Mythos, але безпечне для загального використання. Claude Mythos 5 — «приватна» базова модель з послабленими обмеженнями в окремих сферах.

Ключова відмінність між ними полягає в роботі захисних класифікаторів. Публічна модель відстежує чутливі запити у сферах кібербезпеки, біології, хімії, а також спроби дистиляції моделі. У таких випадках запит перенаправляють до Claude Opus 4.8.

Джерело: Anthropic.

«Щоб безпечно та швидко випустити модель, ми налаштували ці механізми захисту досить консервативно — іноді вони спрацьовують на нешкідливі запити, хоча в середньому це відбувається менш ніж у 5% сесій», — підкреслили в компанії.

Fable 5 доступна через класичну підписку у веб-інтерфейсі та Claude API.

Обидві моделі отримали однакову ціну: $10 за 1 млн вхідних токенів і $50 — за 1 млн вихідних. У компанії вказали, що це менше ніж половина від вартості Claude Mythos Preview.

Детальніше про закритий флагман

На старті Claude Mythos 5 відкрили для деяких довірених учасників, зокрема членів Project Glasswing. У межах програми новинка замінила Claude Mythos Preview.

Anthropic планує розширити доступ для завдань кібербезпеки та окремих біомедичних сценаріїв до кінця 2026 року.

Як і Fable, Mythos має обмеження, однак володіє розширеним доступом у низці напрямів. 

Anthropic назвала закрите рішення своєю найсильнішою моделлю для завдань у сфері кібербезпеки, що «відмінно справляється з виявленням і використанням вразливостей ПЗ». Результати в біології також демонструють прискорення на окремих етапах розробки ліків приблизно у 10 разів. 

Джерело: Anthropic.

«Для дев’яти з 14 білкових мішеней у дослідженні вдалося отримати перспективні сполуки для розробки лікарських препаратів, які ми наразі вивчаємо»., — підкреслили в компанії. 

Для біомедичних дослідників Anthropic готує окремий контур доступу до версії Fable 5 без обмежень з біології та хімії, але зі збереженням цензури в напрямі кіберзахисту.

Перша публічна модель класу Mythos

Anthropic називає Fable 5 найпотужнішою серед моделей Claude, що виходили у публічний доступ. Акцент зроблено на довгих і складних завданнях. Серед напрямів компанія виділяє програмування, аналітичну роботу з документами, зір, пам’ять і наукові дослідження.

Стартап не розкрив інженерні деталі архітектури моделі. Зокрема, наразі недоступна інформація про кількість параметрів, схему навчання та опис стека. Відкрита ліцензія також не публікувалася.

Під час попереднього тестування Stripe повідомила, що Fable 5 стиснула місяці розробки до кількох днів. Рішення перенесло кодову базу Ruby на 50 млн рядків всього за один день. На таке завдання в команди розробників пішло б два місяці, зазначили аналітики. 

Джерело: Anthropic.

Fable 5 також ефективніша з погляду витрат токенів, ніж попередні версії Claude: в оцінці FrontierCode від Cognition модель показує найкращі результати серед передових ШІ-рішень.

Джерело: Anthropic.

У тесті Hebbia Finance Benchmark для аналізу логічного мислення Fable 5 має найвищий бал серед усіх моделей.

Однією з головних функцій моделі називають «зір». ШІ може вилучати точні числа з детальних наукових діаграм і виконувати складні задачі, як-от відновлення вихідного коду вебзастосунку лише за скриншотами. 

Крім того, Fable 5 потребує менше допоміжних засобів. Наприклад, попередні моделі Claude насилу справлялися з грою в Pokémon FireRed навіть із додатковими інструментами, але нова версія пройшла її з мінімальною допомогою.

Fable 5 володіє покращеною пам’яттю, зберігаючи фокус на мільйонах токенів у тривалих завданнях і поліпшуючи результати, використовуючи власні нотатки.

Нагадаємо, на початку червня представники Anthropic попередили про ризики самовдосконалення ШІ. За внутрішніми даними, понад 80% коду актуальних продуктів компанії написав Claude.

Читайте ForkLog UA в соціальних мережах

Знайшли помилку в тексті? Виділіть її та натисніть CTRL+ENTER

Матеріали за темою

Ми використовуємо файли cookie для покращення якості роботи.

Користуючись сайтом, ви погоджуєтесь з Політикою приватності.

OK
Exit mobile version