Anthropic wird Claude Mythos der Öffentlichkeit zugänglich machen, sobald Schutzmaßnahmen aufholen – vielleicht in 12 Monaten

Anthropic sagt, es wolle der Öffentlichkeit Zugang zu Mythos, its vulnerability-hunting AI verschaffen, allerdings erst, wenn Schutzmaßnahmen entwickelt sind, die es heute noch nicht gibt.

Zentrale Punkte:

Anthropic plant, Mythos-Klasse-Modelle breit zu veröffentlichen, nachdem der Zugang für Regierungen der USA und verbündeter Staaten ausgeweitet wurde.

Das Unternehmen räumt ein, dass bislang kein Anbieter – einschließlich Anthropic selbst – Schutzmechanismen gebaut hat, die Missbrauch zuverlässig verhindern.

Mythos hat mehr als 23.000 Probleme in 1.000 Open-Source-Projekten markiert, darunter 6.202 Schwachstellen mit hoher oder kritischer Schwere.

Veröffentlichung von Anthropic Mythos

Anthropic hat den Plan in einem Update zu Project Glasswing, seinem Sicherheitsprogramm mit eingeschränktem Zugang, bestätigt; ein separater Bericht weist jedoch auf einen unsicheren Zeitplan hin.

Das Unternehmen erklärte, zunächst mit Regierungen der USA und verbündeter Staaten zusammenzuarbeiten, um das Programm auszuweiten. Eine breitere Veröffentlichung von „Mythos-Klasse-Modellen“ soll in naher Zukunft folgen.

Anthropic sprach die Risiken deutlich an. Das Unternehmen erklärte, dass bisher kein Unternehmen – auch nicht Anthropic selbst – Schutzmechanismen geschaffen habe, die stark genug sind, um Missbrauch des Modells und daraus resultierende schwere Schäden zuverlässig zu verhindern.

Dennoch rechnet das Unternehmen mit einer schnellen Verbreitung ähnlicher Werkzeuge und prognostiziert, dass Modelle auf Mythos‑Niveau innerhalb von sechs bis zwölf Monaten weit verfügbar sein werden.

Mythos wurde im April vorgestellt. Laut Anthropic erzeugte es in Tests in 72,4 Prozent der Fälle funktionierende Exploits, gegenüber nahezu null Prozent bei einem früheren Claude-Modell.

Außerdem lesenswert: Cisco Research Shows Frontier AI Models Failing Under Multi-Turn Attacks

Mythos und gefundene Schwachstellen

Seit seiner Einführung hat das Modell mehr als 1.000 Open-Source-Projekte gescannt und 23.019 Probleme identifiziert, von denen 6.202 als hoch oder kritisch eingestuft wurden.

Ein Fund stach besonders hervor: Mythos entdeckte eine Schwachstelle in der Kryptografie-Bibliothek wolfSSL, die auf Milliarden von Geräten im Einsatz ist. Angreifer hätten damit Zertifikate fälschen und sich als Banken oder E-Mail-Anbieter ausgeben können. Die Lücke wurde inzwischen geschlossen.

Die Flut der Meldungen überfordert jedoch die Personen, die sie beheben sollen. Maintainer von Open-Source-Projekten baten Anthropic, die Offenlegung zu verlangsamen, da das Volumen ihre Kapazitäten übersteigt.

Forschende sehen ein tiefer liegendes Ungleichgewicht. Laut Anthropic ist das Auffinden von Bugs inzwischen deutlich einfacher als deren Behebung. Das Unternehmen hat sich deshalb mit dem Alpha-Omega-Projekt der Open Source Security Foundation zusammengetan, um Maintainer bei der Priorisierung des Rückstaus zu unterstützen.

Die Systemkarte zu Claude Mythos prognostiziert, dass KI langfristig Verteidiger begünstigen wird, auch wenn Anthropic einräumt, dass Angreifer derzeit noch im Vorteil sein könnten.

Als Mythos erstmals vorgestellt wurde, erhielten mehr als 50 Organisationen – darunter Apple, Microsoft und Google – Zugang sowie Nutzungscredits im Wert von rund 100 Millionen US‑Dollar. Der breiten Öffentlichkeit wurde das Modell jedoch vorenthalten, da es Software-Schwachstellen in Waffen verwandeln könnte.

Als Nächstes lesen: Cardano Whales Seize 67.5% Of ADA Supply, A Six-Year High