Новий чекпоінт Anthropic's Claude Mythos Preview став першим AI‑моделем, що розв'язав обидві урядові симуляції кібератак Великої Британії, викликавши нові питання щодо автономного хакінгу.
AISI повідомляє про прорив Mythos
Британський AI Security Institute у середу повідомив, що новіший чекпоінт Mythos завершив свій 32‑кроковий діапазон атаки на корпоративну мережу, «The Last Ones», у 6 з 10 спроб. Попередня версія впоралася лише з 3 із 10.
Оновлена модель також зламала «Cooling Tower» — діапазон для систем промислового контролю, який жодна попередня модель не проходила, — у 3 із 10 спроб.
Конкурент OpenAI GPT‑5.5 тестували на тій самій вправі. Він вирішив «The Last Ones» у 3 із 10 спроб, але не завершив «Cooling Tower».
AISI запускала діапазони з обчислювальним бюджетом 100 мільйонів токенів на спробу, і відомство відзначило, що продуктивність продовжувала масштабуватися на цій стелі, що свідчить: вищі бюджети могли б ще збільшити частку успішних спроб.
Також читайте: Southeast Asia Blockchain Week Brings Ripple, Avalanche, Solana Foundation, And K-Pop To Bangkok
Час подвоєння продовжує скорочуватися
AISI відстежує прогрес у кіберсфері через бенчмарки часових горизонтів, вимірюючи, завдання якої тривалості модель здатна виконати автономно з надійністю 80%. У листопаді 2025 року відомство оцінювало час подвоєння у 8 місяців. До лютого 2026‑го ця цифра скоротилася до 4,7 місяця, і відтоді і Mythos, і GPT‑5.5 перевищили навіть цей пришвидшений тренд.
Відомство визнало невизначеність щодо того, чи свідчать останні результати про нове прискорення, чи про одноразовий стрибок.
Некомерційна дослідницька організація METR, яка відстежує AI на програмних завданнях, а не кібердіапазонах, отримала подібну цифру — близько 4,2 місяця. В AISI заявили, що таке зближення підсилює аргумент, що тренд відображає реальне зростання можливостей, а не особливість одного набору оцінювань.
Інститут наголосив, що в його діапазонах немає активних захисників, тож результати показують, що моделі можуть робити проти слабко захищених мереж, а не проти укріплених корпоративних систем.
Чому стрибки можливостей мають значення
Новіший чекпоінт Mythos не супроводжувався виходом нової моделі. AISI використовував ту саму версію, яку Anthropic розгорнула минулого місяця в межах Project Glasswing, своєї програми партнерства у сфері безпеки, після отримання оновленої збірки тієї ж моделі.
«Помітні стрибки можливостей не завжди вимагають нових релізів моделей», — написав інститут. Це суперечить припущенню, що захисники можуть орієнтуватися на цикли випусків.
Anthropic представила Mythos Preview 7 квітня, подавши модель як поворотний момент для індустрії безпеки після того, як вона виявила нульові‑дні у провідних операційних системах та браузерах в межах внутрішніх тестів. Компанія заявила, що стримувала ширший реліз через ці можливості, а квітнева оцінка AISI вже тоді відзначила Mythos як очевидний крок уперед порівняно з попередніми передовими системами.
Читайте далі: Gemini Space Station Hit By Multiple Securities Fraud Claims After IPO





