Il nuovo modello di OpenAI, GPT-5.5, può concatenare in modo autonomo una violazione della sicurezza di rete aziendale in 32 passaggi (corporate network breach) e risolvere un enigma di reverse engineering da 12 ore in circa 10 minuti.
Risultati della valutazione cyber dell'AISI
L'AI Security Institute del Regno Unito, un organismo di ricerca all'interno del Department of Science, Innovation and Technology britannico, ha pubblicato la sua valutazione giovedì.
I ricercatori hanno scoperto che GPT-5.5 è solo il secondo modello a risolvere completamente "The Last Ones", una simulazione multi‑fase realizzata con SpecterOps. Ha completato la catena in due tentativi su dieci.
Il primo a superare il test è stato l'anteprima di Anthropic's Claude Mythos Preview, che è riuscito in tre tentativi su dieci. L'AISI stima che un esperto umano impiegherebbe circa 20 ore per completare la stessa kill chain su quattro subnet e circa 20 host.
Nei compiti di livello Expert, GPT-5.5 ha ottenuto un tasso di superamento del 71,4%, di poco superiore alla versione Mythos Preview al 68,6% e nettamente sopra GPT-5.4 al 52,4%.
Leggi anche: Why 75% Of Institutions Stay Bullish On Bitcoin Despite Coinbase's Mythos Warning
Rischio di jailbreak e risposta normativa
L'AISI ha segnalato un jailbreak universale che ha aggirato le misure di sicurezza del modello per ogni richiesta di cyberattacco malevola testata. Lo sfruttamento ha richiesto sei ore di lavoro di red‑teaming da parte di esperti per essere sviluppato, e un problema di configurazione ha impedito la verifica della patch di OpenAI.
L'agenzia ha avvertito che le capacità di cyber‑attacco offensivo ora sembrano emergere come sottoprodotto dei più ampi progressi nel ragionamento e nell'autonomia.
Ad aprile, la revisione di Mythos Preview marked the first time any frontier model finished the corporate attack end‑to‑end da parte dell'AISI ha rappresentato la prima volta in cui un modello di frontiera ha completato l'intera gamma di attacchi aziendali, inquadrando GPT-5.5 come conferma di una tendenza piuttosto che come un salto isolato.
Leggi dopo: Crypto VC Funding Crashes To $659M In April, A 2-Year Low





