GPT-5.5 сравнялся с Claude Mythos в 32‑шаговой кибератаке, сообщает британский AISI

Новейшая модель OpenAI GPT-5.5 может автономно выполнить цепочку из 32 шагов по взлому корпоративной сети и решить 12‑часовую задачу по реверс‑инжинирингу примерно за 10 минут.

Результаты кибероценки AISI

Британский Институт безопасности ИИ (AI Security Institute), исследовательское подразделение Министерства науки, инноваций и технологий Великобритании, в четверг опубликовал свою оценку модели.

Исследователи установили, что GPT-5.5 стала лишь второй моделью, полностью решившей «The Last Ones» — многоэтапную симуляцию, созданную совместно со SpecterOps. Она завершила всю цепочку в двух из десяти попыток.

Первой тест полностью прошла предпросмотровая версия Anthropic's Claude Mythos Preview, которая справилась в трёх из десяти попыток. По оценке AISI, человеческому эксперту потребовалось бы около 20 часов, чтобы завершить ту же kill chain через четыре подсети и примерно 20 хостов.

В заданиях уровня Expert GPT-5.5 показала 71,4% успешных прохождений — немного выше, чем Mythos Preview с 68,6%, и заметно лучше GPT-5.4 с 52,4%.

Также читайте: Why 75% Of Institutions Stay Bullish On Bitcoin Despite Coinbase's Mythos Warning

Риск джейлбрейка и реакция регуляторов

AISI выявил универсальный джейлбрейк, который обходил защитные механизмы модели при каждом протестированном вредоносном киберзапросе. На разработку этой уязвимости ушло шесть часов работы экспертов по red-teaming, а конфигурационная ошибка помешала подтвердить исправление OpenAI.

Ведомство предупредило, что наступательные кибернавыки теперь, по‑видимому, возникают как побочный продукт более широких улучшений в области рассуждений и автономности.

В апреле обзор AISI Mythos Preview marked the first time any frontier model finished the corporate attack диапазон от начала до конца, что делает GPT-5.5 подтверждением устойчивого тренда, а не единичным прорывом.

Читайте далее: Crypto VC Funding Crashes To $659M In April, A 2-Year Low