Anthropic's Claude Mythos Preview became the first AI model to complete a full simulated corporate network attack, en loste 73% van cybersbeveiligingstaken op expertniveau op die geen enkel eerder AI‑systeem aankon, volgens het UK AI Security Institute (AISI).
AISI‑evaluatie cybercapaciteiten
AISI, een onderzoeksorgaan binnen het Britse Department for Science, Innovation and Technology, ran twee reeksen tests op het model nadat Anthropic het op 7 april aankondigde.
Het bedrijf besloot Claude Mythos niet breed uit te brengen, maar granting in plaats daarvan beperkte toegang aan beveiligingsonderzoeksbedrijven.
In capture‑the‑flag‑evaluaties behaalde Claude Mythos een succesratio van 73% op taken op expertniveau.
Voor april 2025 had geen enkel model een van deze taken opgelost. AISI bouwde ook een 32‑stappen‑simulatie van een aanval op een bedrijfsnetwerk, “The Last Ones” genaamd, ontworpen om menselijke professionals ongeveer 20 uur te kosten. Claude Mythos voltooide de volledige simulatie in 3 van de 10 pogingen en haalde gemiddeld 22 van de 32 stappen, vergeleken met 16 voor Claude Opus 4.6, de op één na beste deelnemer.
“Het succes van Mythos Preview op één cyberrange geeft aan dat het ten minste in staat is om autonoom kleine, zwak verdedigde en kwetsbare bedrijfssystemen aan te vallen waar al toegang tot een netwerk is verkregen,” aldus AISI.
Also Read: Crypto Funds Pull $1.1B In Best Week Since January As Risk Appetite Returns
Zero‑day‑exploits
Het eigen red‑team van Anthropic ontdekte dat Claude Mythos zero‑day‑kwetsbaarheden kan detecteren en uitbuiten in alle grote besturingssystemen en toonaangevende webbrowsers wanneer een gebruiker het daar expliciet opdracht toe geeft. Het bedrijf verklaarde dat meer dan 99% van de ontdekte kwetsbaarheden nog niet is gepatcht.
“We zijn beperkt in wat we hier kunnen melden. Het zou onverantwoord zijn om details over deze kwetsbaarheden te onthullen,” aldus Anthropic.
De capaciteiten van het model hebben inmiddels reached de beleidskringen bereikt.
Volgens Reuters hebben de Amerikaanse minister van Financiën Scott Bessent en Federal Reserve‑voorzitter Jerome Powell een spoedoverleg held met topbestuurders van grote banken om mogelijke cyberrisico’s rond het model te bespreken.
Reactie van Anthropic op veiligheidsgebied
Anthropic lanceerde Project Glasswing tegelijk met de aankondiging van het model, en beschreef het als een poging om Claude Mythos in te zetten voor het beveiligen van kritieke software. Het bedrijf presenteerde dit initiatief als voorbereiding op een tijdperk waarin beveiligingsteams AI‑gestuurde aanvallers voor moeten blijven. AISI adviseerde organisaties om prioriteit te geven aan fundamentele maatregelen voor cyberbeveiliging, waaronder regelmatig patchen, strikte toegangscontroles, het hardenen van configuraties en uitgebreide logging.
De aankondiging van 7 april volgde op maanden van toenemende bezorgdheid over de rol van AI in cyberbeveiliging. Eerdere frontier‑modellen hadden beperkte offensieve capaciteiten laten zien, maar geen daarvan had CTF‑benchmarks op expertniveau gehaald of meerstapsaanvalsscripts voltooid vóór Claude Mythos.






