Anthropic afferma di voler offrire al pubblico l’accesso a Mythos, its vulnerability-hunting AI, ma solo dopo aver costruito misure di sicurezza che oggi non esistono ancora.
Punti chiave:
- Anthropic prevede di rilasciare i modelli di classe Mythos in modo ampio dopo aver prima esteso l’accesso a governi statunitensi e alleati.
- L’azienda ammette che nessuna realtà, inclusa se stessa, ha sviluppato misure di sicurezza abbastanza solide da impedire abusi.
- Mythos ha individuato oltre 23.000 problemi in 1.000 progetti open source, inclusi 6.202 difetti ad alta o critica gravità.
Rilascio di Anthropic Mythos
Anthropic ha confermato il piano in un aggiornamento di Project Glasswing, il suo programma di sicurezza a accesso limitato; un rapporto separato ha segnalato che la tempistica resta incerta.
L’azienda ha dichiarato che collaborerà prima con governi degli Stati Uniti e dei paesi alleati per ampliare il programma. Un rilascio più esteso dei “modelli di classe Mythos” seguirebbe in un futuro prossimo.
Anthropic è stata esplicita sui rischi. Ha dichiarato che nessuna azienda, inclusa la stessa Anthropic, ha realizzato misure di sicurezza abbastanza forti da impedire che il modello venga usato in modo improprio e causi danni gravi.
Nonostante ciò, l’azienda prevede una rapida diffusione di strumenti simili, stimando che modelli di livello Mythos diventeranno ampiamente disponibili entro sei‑dodici mesi.
Mythos ha debuttato ad aprile. Anthropic ha dichiarato che, nei test, ha generato exploit funzionanti nel 72,4% dei casi, contro una percentuale quasi nulla per un precedente modello Claude.
Da leggere anche: Cisco Research Shows Frontier AI Models Failing Under Multi-Turn Attacks
Risultati di Mythos sulle vulnerabilità
Dalla sua introduzione, il modello ha analizzato oltre 1.000 progetti open source e individuato 23.019 problemi, di cui 6.202 classificati come di gravità alta o critica.
Un risultato è emerso in particolare. Mythos ha scoperto una falla nella libreria crittografica wolfSSL, usata da miliardi di dispositivi, che avrebbe potuto consentire agli attaccanti di falsificare certificati e impersonare banche o provider di posta elettronica. Il problema è stato successivamente corretto.
L’ondata di segnalazioni ha messo sotto pressione chi dovrebbe risolverle. I manutentori dei progetti open source hanno chiesto ad Anthropic di rallentare le divulgazioni, sostenendo che il volume supera la loro capacità di intervento.
I ricercatori vedono uno squilibrio più profondo. Secondo Anthropic, trovare bug è ora molto più facile che correggerli, e l’azienda ha avviato una collaborazione con il progetto Alpha‑Omega della Open Source Security Foundation per aiutare i manutentori a gestire l’arretrato.
La system card di Claude Mythos prevede che l’IA finirà per favorire i difensori, sebbene Anthropic riconosca che, per il momento, il vantaggio possa essere ancora dalla parte degli aggressori.
Quando Mythos è stato presentato per la prima volta, Anthropic ha concesso l’accesso a oltre 50 organizzazioni, tra cui Apple, Microsoft e Google, insieme a circa 100 milioni di dollari in crediti di utilizzo, negando però il modello al grande pubblico a causa della sua capacità di trasformare le falle software in armi.
Da leggere dopo: Cardano Whales Seize 67.5% Of ADA Supply, A Six-Year High





