Новейшая модель OpenAI GPT-5.5 способна автономно выстраивать цепочку из 32 шагов для взлома корпоративной сети и решать 12‑часовую задачу по реверс‑инжинирингу примерно за 10 минут.
Результаты кибероценки AISI
Британский Институт безопасности ИИ (AI Security Institute), исследовательское подразделение Министерства науки, инноваций и технологий Великобритании, в четверг опубликовал свою оценку.
Исследователи установили, что GPT-5.5 — лишь вторая модель, полностью решившая «The Last Ones», многоэтапную симуляцию, созданную совместно со SpecterOps. Она завершила цепочку в двух из десяти попыток.
Первой пройти тест смог Anthropic's Claude Mythos Preview, выполнив три из десяти попыток. По оценке AISI, человеческому эксперту понадобилось бы около 20 часов, чтобы завершить ту же kill chain в четырёх подсетях и примерно на 20 хостах.
В задачах уровня «Эксперт» GPT-5.5 показал 71,4% успешных решений — чуть выше, чем Mythos Preview с 68,6%, и значительно лучше GPT-5.4 с 52,4%.
Также читайте: Why 75% Of Institutions Stay Bullish On Bitcoin Despite Coinbase's Mythos Warning
Риск джейлбрейка и реакция регуляторов
AISI выявил универсальный джейлбрейк, который обходил защитные механизмы модели для каждого протестированного вредоносного киберзапроса. На разработку этой уязвимости ушло шесть часов работы экспертов по red‑teaming, а проблема конфигурации помешала верифицировать патч OpenAI.
Агентство предупредило, что наступательные кибервозможности теперь, по‑видимому, возникают как побочный эффект общих улучшений в области рассуждений и автономности.
В апреле обзор AISI Mythos Preview marked the first time any frontier model finished the corporate attack от начала до конца, сделав GPT-5.5 подтверждением устойчивого тренда, а не единичным скачком.
Читайте далее: Crypto VC Funding Crashes To $659M In April, A 2-Year Low





