Claude Mythos löst 32-stufigen AISI-Hack in 6 von 10 Versuchen

Claude Mythos löst 32-stufigen AISI-Hack in 6 von 10 Versuchen

Ein neuer Checkpoint der Anthropic's Claude Mythos Preview ist das erste KI-Modell geworden, das beide Cyberangriffssimulationen der britischen Regierung löst und damit neue Fragen zu autonomem Hacking aufwirft.

AISI meldet Mythos-Durchbruch

Das britische AI Security Institute berichtete am Mittwoch, dass der neuere Mythos-Checkpoint seinen 32-stufigen Angriffsparcours auf ein Unternehmensnetzwerk, „The Last Ones“, in 6 von 10 Versuchen abschloss. Die frühere Version hatte nur 3 von 10 geschafft.

Das aktualisierte Modell knackte außerdem „Cooling Tower“, eine Industrial-Control-System-Range, die zuvor kein Modell bestanden hatte, in 3 von 10 Versuchen.

Der Rivale OpenAI's GPT-5.5 wurde mit derselben Übung getestet. Er löste „The Last Ones“ in 3 von 10 Versuchen, schaffte aber „Cooling Tower“ nicht.

AISI führte die Ranges mit einem Compute-Budget von 100 Millionen Tokens pro Versuch durch und merkte an, dass die Leistung bei dieser Obergrenze weiter skaliert habe – was darauf hindeutet, dass höhere Budgets die Erfolgsquoten weiter erhöhen würden.

Auch lesen: Southeast Asia Blockchain Week Brings Ripple, Avalanche, Solana Foundation, And K-Pop To Bangkok

Verdopplungszeit wird immer kürzer

AISI verfolgt den Cyber-Fortschritt über Zeit­horizont-Benchmarks und misst, welche Dauer eine autonome Aufgabe haben kann, die ein Modell mit 80 % Zuverlässigkeit abschließt. Im November 2025 schätzte die Behörde eine Verdopplungszeit von 8 Monaten. Bis Februar 2026 hatte sich diese Zahl auf 4,7 Monate verkürzt, und sowohl Mythos als auch GPT-5.5 haben seither den schnelleren Trend übertroffen.

Die Behörde räumte ein, dass unklar sei, ob die neuesten Ergebnisse eine neue Beschleunigung markieren oder einen einmaligen Sprung darstellen.

Die Forschungsorganisation METR, die KI an Softwareaufgaben statt an Cyberranges misst, hat eine ähnliche Zahl von rund 4,2 Monaten ermittelt. AISI erklärte, diese Konvergenz stärke die Annahme, dass der Trend reale Fähigkeitsgewinne widerspiegele und nicht nur eine Besonderheit einer bestimmten Evaluierungssuite sei.

Das Institut betonte, dass seine Ranges keine aktiven Verteidiger enthalten. Die Ergebnisse zeigten daher, was Modelle gegen schwach geschützte Netzwerke leisten können – nicht gegen gehärtete Unternehmenssysteme.

Warum Fähigkeitssprünge wichtig sind

Der neuere Mythos-Checkpoint erschien nicht mit einem komplett neuen Modell-Release. AISI nutzte dieselbe Version, die Anthropic letzten Monat mit Project Glasswing – seinem Sicherheits­partnerschafts­programm – ausgerollt hatte, nachdem es einen aktualisierten Build desselben Modells erhalten hatte.

„Bemerkenswerte Fähigkeitssprünge erfordern nicht immer neue Modell-Releases“, schrieb das Institut. Das widerspricht der Annahme, dass sich Verteidiger am Tempo von Release-Zyklen orientieren können.

Anthropic stellte Mythos Preview am 7. April vor und präsentierte das Modell als Wendepunkt für die Sicherheitsbranche, nachdem es in internen Tests Zero-Day-Schwachstellen in großen Betriebssystemen und Browsern identifiziert hatte. Das Unternehmen erklärte, es habe eine breitere Veröffentlichung zurückgehalten – gerade wegen dieser Fähigkeiten – und AISI bewertete Mythos in einer früheren Analyse im April als klaren Sprung gegenüber früheren Frontier-Systemen.

Als Nächstes lesen: Gemini Space Station Hit By Multiple Securities Fraud Claims After IPO

Haftungsausschluss und Risikowarnung: Die in diesem Artikel bereitgestellten Informationen dienen nur Bildungs- und Informationszwecken und basieren auf der Meinung des Autors. Sie stellen keine Finanz-, Anlage-, Rechts- oder Steuerberatung dar. Kryptowährungsassets sind hochvolatil und unterliegen hohen Risiken, einschließlich des Risikos, Ihre gesamte oder einen erheblichen Teil Ihrer Investition zu verlieren. Der Handel oder das Halten von Krypto-Assets ist möglicherweise nicht für alle Anleger geeignet. Die in diesem Artikel geäußerten Ansichten sind ausschließlich die des Autors/der Autoren und repräsentieren nicht die offizielle Politik oder Position von Yellow, seinen Gründern oder seinen Führungskräften. Führen Sie immer Ihre eigenen gründlichen Recherchen (D.Y.O.R.) durch und konsultieren Sie einen lizenzierten Finanzprofi, bevor Sie eine Anlageentscheidung treffen.
Claude Mythos löst 32-stufigen AISI-Hack in 6 von 10 Versuchen | Yellow.com