Claude Mythos розв'язує 32-крокову AISI-атаку у 6 з 10 спроб

Claude Mythos розв'язує 32-крокову AISI-атаку у 6 з 10 спроб

Новий чекпоінт Anthropic's Claude Mythos Preview став першим AI‑моделем, що розв'язав обидві урядові симуляції кібератак Великої Британії, викликавши нові питання щодо автономного хакінгу.

AISI повідомляє про прорив Mythos

Британський AI Security Institute у середу повідомив, що новіший чекпоінт Mythos завершив свій 32‑кроковий діапазон атаки на корпоративну мережу, «The Last Ones», у 6 з 10 спроб. Попередня версія впоралася лише з 3 із 10.

Оновлена модель також зламала «Cooling Tower» — діапазон для систем промислового контролю, який жодна попередня модель не проходила, — у 3 із 10 спроб.

Конкурент OpenAI GPT‑5.5 тестували на тій самій вправі. Він вирішив «The Last Ones» у 3 із 10 спроб, але не завершив «Cooling Tower».

AISI запускала діапазони з обчислювальним бюджетом 100 мільйонів токенів на спробу, і відомство відзначило, що продуктивність продовжувала масштабуватися на цій стелі, що свідчить: вищі бюджети могли б ще збільшити частку успішних спроб.

Також читайте: Southeast Asia Blockchain Week Brings Ripple, Avalanche, Solana Foundation, And K-Pop To Bangkok

Час подвоєння продовжує скорочуватися

AISI відстежує прогрес у кіберсфері через бенчмарки часових горизонтів, вимірюючи, завдання якої тривалості модель здатна виконати автономно з надійністю 80%. У листопаді 2025 року відомство оцінювало час подвоєння у 8 місяців. До лютого 2026‑го ця цифра скоротилася до 4,7 місяця, і відтоді і Mythos, і GPT‑5.5 перевищили навіть цей пришвидшений тренд.

Відомство визнало невизначеність щодо того, чи свідчать останні результати про нове прискорення, чи про одноразовий стрибок.

Некомерційна дослідницька організація METR, яка відстежує AI на програмних завданнях, а не кібердіапазонах, отримала подібну цифру — близько 4,2 місяця. В AISI заявили, що таке зближення підсилює аргумент, що тренд відображає реальне зростання можливостей, а не особливість одного набору оцінювань.

Інститут наголосив, що в його діапазонах немає активних захисників, тож результати показують, що моделі можуть робити проти слабко захищених мереж, а не проти укріплених корпоративних систем.

Чому стрибки можливостей мають значення

Новіший чекпоінт Mythos не супроводжувався виходом нової моделі. AISI використовував ту саму версію, яку Anthropic розгорнула минулого місяця в межах Project Glasswing, своєї програми партнерства у сфері безпеки, після отримання оновленої збірки тієї ж моделі.

«Помітні стрибки можливостей не завжди вимагають нових релізів моделей», — написав інститут. Це суперечить припущенню, що захисники можуть орієнтуватися на цикли випусків.

Anthropic представила Mythos Preview 7 квітня, подавши модель як поворотний момент для індустрії безпеки після того, як вона виявила нульові‑дні у провідних операційних системах та браузерах в межах внутрішніх тестів. Компанія заявила, що стримувала ширший реліз через ці можливості, а квітнева оцінка AISI вже тоді відзначила Mythos як очевидний крок уперед порівняно з попередніми передовими системами.

Читайте далі: Gemini Space Station Hit By Multiple Securities Fraud Claims After IPO

Відмова від відповідальності та попередження про ризики: Інформація, надана в цій статті, призначена лише для освітніх та інформаційних цілей і базується на думці автора. Вона не є фінансовою, інвестиційною, правовою чи податковою консультацією. Криптоактиви є надзвичайно волатильними та піддаються високому ризику, включаючи ризик втрати всіх або значної частини ваших інвестицій. Торгівля або утримання криптоактивів може не підходити для всіх інвесторів. Думки, висловлені в цій статті, належать виключно автору(ам) і не представляють офіційну політику чи позицію Yellow, її засновників або керівників. Завжди проводьте власне ретельне дослідження (D.Y.O.R.) та консультуйтесь з ліцензованим фінансовим фахівцем перед прийняттям будь-яких інвестиційних рішень.
Останні новини
Показати всі новини
Схожі новини
Схожі дослідницькі статті
Схожі навчальні матеріали
Claude Mythos розв'язує 32-крокову AISI-атаку у 6 з 10 спроб | Yellow.com