Ein neuer Checkpoint der Anthropic's Claude Mythos Preview ist das erste KI-Modell geworden, das beide Cyberangriffssimulationen der britischen Regierung löst und damit neue Fragen zu autonomem Hacking aufwirft.
AISI meldet Mythos-Durchbruch
Das britische AI Security Institute berichtete am Mittwoch, dass der neuere Mythos-Checkpoint seinen 32-stufigen Angriffsparcours auf ein Unternehmensnetzwerk, „The Last Ones“, in 6 von 10 Versuchen abschloss. Die frühere Version hatte nur 3 von 10 geschafft.
Das aktualisierte Modell knackte außerdem „Cooling Tower“, eine Industrial-Control-System-Range, die zuvor kein Modell bestanden hatte, in 3 von 10 Versuchen.
Der Rivale OpenAI's GPT-5.5 wurde mit derselben Übung getestet. Er löste „The Last Ones“ in 3 von 10 Versuchen, schaffte aber „Cooling Tower“ nicht.
AISI führte die Ranges mit einem Compute-Budget von 100 Millionen Tokens pro Versuch durch und merkte an, dass die Leistung bei dieser Obergrenze weiter skaliert habe – was darauf hindeutet, dass höhere Budgets die Erfolgsquoten weiter erhöhen würden.
Auch lesen: Southeast Asia Blockchain Week Brings Ripple, Avalanche, Solana Foundation, And K-Pop To Bangkok
Verdopplungszeit wird immer kürzer
AISI verfolgt den Cyber-Fortschritt über Zeithorizont-Benchmarks und misst, welche Dauer eine autonome Aufgabe haben kann, die ein Modell mit 80 % Zuverlässigkeit abschließt. Im November 2025 schätzte die Behörde eine Verdopplungszeit von 8 Monaten. Bis Februar 2026 hatte sich diese Zahl auf 4,7 Monate verkürzt, und sowohl Mythos als auch GPT-5.5 haben seither den schnelleren Trend übertroffen.
Die Behörde räumte ein, dass unklar sei, ob die neuesten Ergebnisse eine neue Beschleunigung markieren oder einen einmaligen Sprung darstellen.
Die Forschungsorganisation METR, die KI an Softwareaufgaben statt an Cyberranges misst, hat eine ähnliche Zahl von rund 4,2 Monaten ermittelt. AISI erklärte, diese Konvergenz stärke die Annahme, dass der Trend reale Fähigkeitsgewinne widerspiegele und nicht nur eine Besonderheit einer bestimmten Evaluierungssuite sei.
Das Institut betonte, dass seine Ranges keine aktiven Verteidiger enthalten. Die Ergebnisse zeigten daher, was Modelle gegen schwach geschützte Netzwerke leisten können – nicht gegen gehärtete Unternehmenssysteme.
Warum Fähigkeitssprünge wichtig sind
Der neuere Mythos-Checkpoint erschien nicht mit einem komplett neuen Modell-Release. AISI nutzte dieselbe Version, die Anthropic letzten Monat mit Project Glasswing – seinem Sicherheitspartnerschaftsprogramm – ausgerollt hatte, nachdem es einen aktualisierten Build desselben Modells erhalten hatte.
„Bemerkenswerte Fähigkeitssprünge erfordern nicht immer neue Modell-Releases“, schrieb das Institut. Das widerspricht der Annahme, dass sich Verteidiger am Tempo von Release-Zyklen orientieren können.
Anthropic stellte Mythos Preview am 7. April vor und präsentierte das Modell als Wendepunkt für die Sicherheitsbranche, nachdem es in internen Tests Zero-Day-Schwachstellen in großen Betriebssystemen und Browsern identifiziert hatte. Das Unternehmen erklärte, es habe eine breitere Veröffentlichung zurückgehalten – gerade wegen dieser Fähigkeiten – und AISI bewertete Mythos in einer früheren Analyse im April als klaren Sprung gegenüber früheren Frontier-Systemen.
Als Nächstes lesen: Gemini Space Station Hit By Multiple Securities Fraud Claims After IPO





