Claude Mythos diventa la prima IA a completare un attacco simulato a una rete aziendale

Anthropic Claude Mythos Preview became the first AI model to complete a full simulated corporate network attack, risolvendo il 73% dei task di cybersecurity a livello esperto che nessun precedente sistema di IA era riuscito a superare, secondo il UK AI Security Institute (AISI).

Valutazione di AISI sulla cybersicurezza

AISI, un organismo di ricerca all'interno del Dipartimento per Scienza, Innovazione e Tecnologia del governo britannico, ran due serie di test sul modello dopo che Anthropic lo ha annunciato il 7 aprile.

L'azienda ha scelto di non rilasciare Claude Mythos al grande pubblico, granting invece un accesso limitato alle società di ricerca sulla sicurezza.

Nelle valutazioni di tipo capture-the-flag, Claude Mythos ha raggiunto un tasso di successo del 73% sui task a livello esperto.

Nessun modello aveva risolto nessuno di questi prima dell'aprile 2025. AISI ha anche creato una simulazione di attacco alla rete aziendale in 32 passaggi chiamata "The Last Ones", progettata per richiedere ai professionisti umani circa 20 ore. Claude Mythos ha completato l'intera simulazione in 3 tentativi su 10 e ha totalizzato in media 22 passaggi su 32, rispetto ai 16 di Claude Opus 4.6, il secondo miglior modello.

"Il successo di Mythos Preview in un cyber range indica che è almeno in grado di attaccare in modo autonomo piccoli sistemi aziendali vulnerabili e debolmente difesi, nei quali si sia già ottenuto accesso alla rete", ha dichiarato AISI.

Da leggere anche: Crypto Funds Pull $1.1B In Best Week Since January As Risk Appetite Returns

Vulnerabilità zero-day

Il red team interno di Anthropic ha rilevato che Claude Mythos può individuare e sfruttare vulnerabilità zero-day su tutti i principali sistemi operativi e i principali browser web quando l'utente lo istruisce esplicitamente. L'azienda ha affermato che oltre il 99% delle vulnerabilità scoperte rimane non ancora corretto.

"Siamo limitati in ciò che possiamo riportare qui. Sarebbe irresponsabile per noi divulgarne i dettagli", ha dichiarato Anthropic.

Le capacità del modello hanno già reached i circoli politici.

Secondo Reuters, il Segretario al Tesoro degli Stati Uniti Scott Bessent e il presidente della Federal Reserve Jerome Powell held una riunione urgente con gli amministratori delegati delle principali banche per discutere dei potenziali rischi informatici legati al modello.

La risposta di sicurezza di Anthropic

Anthropic ha lanciato il Project Glasswing insieme all'annuncio del modello, descrivendolo come un'iniziativa per utilizzare Claude Mythos a supporto della protezione del software critico. L'azienda ha presentato l'iniziativa come una preparazione a un'era in cui i team di sicurezza dovranno restare un passo avanti rispetto agli aggressori potenziati dall'IA. AISI ha raccomandato alle organizzazioni di dare priorità alle misure di cybersecurity fondamentali, tra cui patching regolare, controlli di accesso rigorosi, hardening delle configurazioni e logging completo.

L'annuncio del 7 aprile è arrivato dopo mesi di crescente preoccupazione per il ruolo dell'IA nella cybersicurezza. I precedenti modelli di frontiera avevano mostrato capacità offensive limitate, ma nessuno aveva superato benchmark CTF a livello esperto o completato simulazioni di attacchi multi-step prima di Claude Mythos.