Anthropic's Claude Mythos Preview та OpenAI's GPT-5.5, дві фронтирні моделі ШІ, виконували автономні кіберзавдання з такою швидкістю, що наявні прогнози можливостей не встигали за ними, повідомили дослідники в середу.
Фронтирні моделі випереджають тренд
Claude Mythos Preview і GPT-5.5 outperformed тренд подвоєння, який AI Security Institute Великої Британії відстежував із кінця 2024 року.
AISI на початку цього року оцінював, що часовий горизонт досягнення 80% надійності в кіберзавданнях подвоюється приблизно кожні п’ять місяців, скоротившись із восьми місяців у листопаді 2025-го. Оновлена версія Mythos Preview solved «The Last Ones», 32-крокову змодельовану атаку на корпоративну мережу, у 6 із 10 спроб і завершила «Cooling Tower» у 3 із 10. GPT-5.5 пройшов «The Last Ones» у 3 із 10 спроб.
Уперше будь-яка модель змогла завершити обидва діапазони задач AISI.
Also Read: Ripple's Schwartz Says Bitcoin's Mining Model Is The Flaw XRP Avoided
Попередження Palo Alto про «vulnpocalypse»
Palo Alto Networks reported про подібні висновки за результатами власних тестів.
Компанія просканувала понад 130 продуктів за останній місяць і виявила 75 реальних вразливостей — більш ніж у сім разів більше за її типовий місячний показник, і всі вони вже виправлені.
Лі Кларіч, технічний директор компанії, заявив, що в організацій є вузьке вікно, перш ніж супротивники отримають подібні можливості.
Він оцінив його як «вузьке вікно в три–п’ять місяців, щоб організації випередили противника».
AISI зауважив, що вибірка поки що невелика, а для найскладніших завдань бракує порівняльних даних із людьми. Попри це, інститут зазначив, що вилучення будь-якої однієї моделі з аналізу змінює оцінку періоду подвоєння менш ніж на місяць. METR, неприбуткова організація, що tracks ШІ на програмних завданнях, отримала майже ідентичний показник — близько чотирьох місяців.
Крива можливостей стає крутішою
Anthropic обмежила ранній реліз Mythos минулого місяця вибраною групою, до якої увійшли Palo Alto Networks, CrowdStrike, Amazon, Apple та JPMorgan.
OpenAI відповіла своїм GPT-5.5-Cyber і кіберініціативою Daybreak.
Темпи змін різко зросли за останні півтора року. AISI скоротив прогнозований період подвоєння з восьми місяців до 4,7 місяців у лютому 2026 року, а потім знову скоротив його після останнього раунду тестів. Перерахований показник тепер ближчий до чотирьох місяців, віддзеркалюючи оцінку METR щодо завдань з розробки ПЗ.
Read Next: Coinbase Opens $100K USDC Loans Against Solana Token Holdings





