GPT-5.5 зрівнявся з Claude Mythos у 32-кроковій кібератаці, повідомляє британський AISI

Новітня модель OpenAI GPT-5.5 може автономно виконати ланцюжок із 32 кроків corporate network breach та розв’язати 12-годинну задачу з реверс-інжинірингу приблизно за 10 хвилин.

Результати кібероцінювання AISI

Британський Інститут безпеки ШІ (U.K. AI Security Institute), дослідницький підрозділ у складі Департаменту науки, інновацій і технологій, у четвер published результати своєї оцінки.

Дослідники з’ясували, що GPT-5.5 є лише другою моделлю, яка повністю розв’язала «The Last Ones» — багатостадійну симуляцію, створену разом із SpecterOps. Вона completed ланцюг у двох із десяти спроб.

Першою тест подолала Anthropic's Claude Mythos Preview, якій вдалося завершити три із десяти спроб. AISI оцінює, що людському експерту знадобилося б близько 20 годин, щоб пройти той самий kill chain через чотири підмережі та приблизно 20 хостів.

У завданнях рівня Expert GPT-5.5 scored показала 71,4% успішних виконань — трохи вище за Mythos Preview з 68,6% і значно вище за GPT-5.4 з 52,4%.

Також читайте: Why 75% Of Institutions Stay Bullish On Bitcoin Despite Coinbase's Mythos Warning

Ризик джейлбрейку та реакція на рівні політики

AISI виявив універсальний джейлбрейк, який обходив захисні механізми моделі для кожного шкідливого кіберзапиту, що тестувався. На розробку експлойта пішло шість годин роботи експертної red team, а проблема з конфігурацією завадила перевірити патч OpenAI.

Установа попередила, що наступальні кібернавички тепер, схоже, виникають як побічний продукт ширших покращень у міркуванні та автономності.

У квітні огляд AISI Mythos Preview marked the first time any frontier model finished the corporate attack у повному діапазоні end-to-end, тож GPT-5.5 розглядається як підтвердження тренду, а не як одноразовий стрибок.

Читайте далі: Crypto VC Funding Crashes To $659M In April, A 2-Year Low