Anthropic sagt, es wolle der Öffentlichkeit Zugang zu seinem Modell Mythos, its vulnerability-hunting AI geben, jedoch erst, wenn Schutzmaßnahmen entwickelt sind, die es heute noch nicht gibt.
Zentrale Punkte:
- Anthropic plant, Mythos‑Klasse‑Modelle breit zu veröffentlichen, nachdem zunächst der Zugang für die USA und verbündete Regierungen ausgeweitet wurde.
- Das Unternehmen räumt ein, dass bislang kein Unternehmen – auch Anthropic selbst nicht – Schutzmechanismen entwickelt hat, die Missbrauch zuverlässig verhindern.
- Mythos hat mehr als 23.000 Probleme in 1.000 Open‑Source‑Projekten gefunden, darunter 6.202 Schwachstellen mit hoher oder kritischer Schwere.
Veröffentlichung von Anthropic Mythos
Anthropic hat den Plan in einem Update zu Project Glasswing, seinem Sicherheitsprogramm mit begrenztem Zugang, bestätigt; ein separater Bericht wies jedoch darauf hin, dass der Zeitplan unsicher sei.
Das Unternehmen erklärte, es werde zunächst mit den Regierungen der USA und verbündeter Staaten zusammenarbeiten, um das Programm auszuweiten. Eine breitere Veröffentlichung von „Mythos‑Klasse‑Modellen“ solle dann in naher Zukunft folgen.
Anthropic äußerte sich offen zu den Risiken. Das Unternehmen erklärte, dass bislang kein Unternehmen – auch nicht Anthropic selbst – Schutzmaßnahmen entwickelt habe, die stark genug sind, um zu verhindern, dass das Modell missbraucht wird und schweren Schaden anrichtet.
Dennoch erwartet das Unternehmen, dass ähnliche Werkzeuge sich schnell verbreiten und sagt voraus, dass Modelle auf Mythos‑Niveau innerhalb von sechs bis zwölf Monaten weit verfügbar sein werden.
Mythos wurde im April vorgestellt. Anthropic gab an, dass das Modell in Tests in 72,4 Prozent der Fälle funktionierende Exploits erzeugte – gegenüber nahezu null Prozent bei einem früheren Claude‑Modell.
Lesen Sie auch: Cisco Research Shows Frontier AI Models Failing Under Multi-Turn Attacks
Mythos‑Funde zu Schwachstellen
Seit seiner Einführung hat das Modell mehr als 1.000 Open‑Source‑Projekte gescannt und dabei 23.019 Probleme aufgedeckt, von denen 6.202 als hoch oder kritisch eingestuft wurden.
Ein Fund stach besonders hervor: Mythos entdeckte eine Schwachstelle in der Kryptografie‑Bibliothek wolfSSL, die auf Milliarden von Geräten verwendet wird und es Angreifern hätte ermöglichen können, Zertifikate zu fälschen und sich als Banken oder E‑Mail‑Anbieter auszugeben. Die Lücke wurde inzwischen geschlossen.
Die Flut an Meldungen hat die Personen überlastet, die diese Probleme beheben sollen. Maintainer von Open‑Source‑Projekten haben Anthropic gebeten, die Offenlegung zu verlangsamen, da das Volumen ihre Kapazitäten übersteigt.
Forschende sehen ein tiefer liegendes Ungleichgewicht. Anthropic argumentiert, dass das Finden von Bugs inzwischen deutlich leichter ist als deren Behebung, und das Unternehmen hat sich mit dem Alpha‑Omega‑Projekt der Open Source Security Foundation zusammengetan, um Maintainer bei der Priorisierung des Rückstaus zu unterstützen.
Die Systemkarte von Claude Mythos prognostiziert, dass KI langfristig die Verteidiger begünstigen wird, auch wenn Anthropic einräumt, dass Angreifer derzeit noch im Vorteil sein könnten.
Als Mythos erstmals vorgestellt wurde, erhielten mehr als 50 Organisationen – darunter Apple, Microsoft und Google – Zugang sowie Nutzungsguthaben im Wert von rund 100 Millionen US‑Dollar, während das Modell der Öffentlichkeit vorenthalten wurde, weil es Software‑Schwachstellen potenziell zur Waffe machen kann.
Als Nächstes lesen: Cardano Whales Seize 67.5% Of ADA Supply, A Six-Year High





