Новейшая модель OpenAI GPT-5.5 может автономно выполнить цепочку из 32 шагов по взлому корпоративной сети и решить 12‑часовую задачу по реверс‑инжинирингу примерно за 10 минут.
Результаты кибероценки AISI
Британский Институт безопасности ИИ (AI Security Institute), исследовательское подразделение Министерства науки, инноваций и технологий Великобритании, в четверг опубликовал свою оценку модели.
Исследователи установили, что GPT-5.5 стала лишь второй моделью, полностью решившей «The Last Ones» — многоэтапную симуляцию, созданную совместно со SpecterOps. Она завершила всю цепочку в двух из десяти попыток.
Первой тест полностью прошла предпросмотровая версия Anthropic's Claude Mythos Preview, которая справилась в трёх из десяти попыток. По оценке AISI, человеческому эксперту потребовалось бы около 20 часов, чтобы завершить ту же kill chain через четыре подсети и примерно 20 хостов.
В заданиях уровня Expert GPT-5.5 показала 71,4% успешных прохождений — немного выше, чем Mythos Preview с 68,6%, и заметно лучше GPT-5.4 с 52,4%.
Также читайте: Why 75% Of Institutions Stay Bullish On Bitcoin Despite Coinbase's Mythos Warning
Риск джейлбрейка и реакция регуляторов
AISI выявил универсальный джейлбрейк, который обходил защитные механизмы модели при каждом протестированном вредоносном киберзапросе. На разработку этой уязвимости ушло шесть часов работы экспертов по red-teaming, а конфигурационная ошибка помешала подтвердить исправление OpenAI.
Ведомство предупредило, что наступательные кибернавыки теперь, по‑видимому, возникают как побочный продукт более широких улучшений в области рассуждений и автономности.
В апреле обзор AISI Mythos Preview marked the first time any frontier model finished the corporate attack диапазон от начала до конца, что делает GPT-5.5 подтверждением устойчивого тренда, а не единичным прорывом.
Читайте далее: Crypto VC Funding Crashes To $659M In April, A 2-Year Low





