Fable 5 schlug GPT 5.5, bevor eine US-Anordnung es offline nahm

Anthropic’s Fable 5 übertraf kurzzeitig OpenAI’s GPT 5.5 in wichtigen KI-Benchmarks, bevor eine US-Exportkontrollanordnung es am 12. Juni offline nahm.

Key Points:

Fable 5 lag vor GPT 5.5 auf Arena, SWE-Bench Pro und wichtigen Coding-Tests.

Das Modell war nur drei Tage verfügbar, bevor die US-Regierung Anthropic anwies, es zu deaktivieren.

GPT 5.5 ist nun standardmäßig das stärkste verfügbare Modell – nicht, weil es Fable 5 überholt hätte.

Fable 5 wird abgeschaltet

Fable 5 wurde nach seinem Start am 9. Juni zum leistungsfähigsten öffentlichen KI-Modell und übertraf GPT 5.5 auf wichtigen Benchmarks, bevor die US-Regierung drei Tage später eingriff.

Das Modell belegte auf Arena den ersten Platz, während GPT 5.5 auf Rang vier lag. Auf SWE-Bench Pro erzielte Fable 5 80,3 %, verglichen mit 58,6 % für GPT 5.5 – ein Abstand von fast 22 Punkten bei realen Software-Engineering-Aufgaben.

Der Vorsprung zeigte sich auch in Coding-Tests. Fable 5 erzielte 1.665 Punkte auf Code Arena, 98 Elo-Punkte mehr als GPT 5.5, und erreichte 29,3 % auf FrontierCode Diamond, wo GPT 5.5 auf 5,7 % kam.

GPT 5.5 hatte einen kleineren Vorteil bei der praktischen Positionierung. Es kostet 5 $ pro Million Input-Tokens und 30 $ pro Million Output-Tokens, während Fable 5 10 $ bzw. 50 $ kostete – damit war das Modell von OpenAI für hohes Anfragevolumen günstiger.

Fable 5 bot zudem ein Kontextfenster von einer Million Tokens und 128.000 Output-Tokens. Anthropic hatte es Pro-, Max-, Team- und Enterprise-Abonnenten ohne Aufpreis bis zum 22. Juni bereitgestellt, bevor die Anordnung dieses Zeitfenster vorzeitig beendete.

Also lesen: Is AI Becoming A Real Advantage In Court? Ask The Lawyer Who Just Beat Meta

GPT 5.5 ist der König

Die Abschaltung folgte auf eine Exportkontrollanordnung vom 12. Juni, die auf eine Jailbreak-Schwachstelle in Fable 5 und der breiteren Mythos-5-Modellfamilie verwies. Anthropic widersprach dem Befund und erklärte, das Problem sei geringfügig, bereits bekannt und auch bei GPT 5.5 ohne besondere Umgehungsmethoden reproduzierbar.

Das Ergebnis ist für den KI-Markt ungewöhnlich.

Entwickler verloren den Zugang zu dem Modell, das die Benchmark-Tabellen anführte, während GPT 5.5 zur besten verfügbaren Option wurde, weil der engste Rivale entfernt wurde.

Diese Unterscheidung ist vor allem für Coding-Workflows entscheidend. Ein Unterschied von 22 Punkten auf SWE-Bench Pro bedeutet den Unterschied zwischen einem Modell, das etwa vier von fünf realen Codebasis-Problemen löst, und einem, das eher drei von fünf bewältigt.

Fable 5s kurzer Lauf zeigte auch, wie schnell sich die Grenze des Machbaren verschieben kann. GPT 5.5 wurde Ende April unter dem internen Codenamen „Spud“ veröffentlicht, aber sein Vorsprung hielt nur an, bis Anthropic im Juni den öffentlichen Zugang zu einem stärkeren Mythos-Klasse-System öffnete.