Anthropic’s Fable 5 übertraf kurzzeitig OpenAI’s GPT 5.5 in wichtigen KI‑Benchmarks, bevor eine US‑Exportkontrollanordnung es am 12. Juni offline nahm.
Key Points:
- Fable 5 lag vor GPT 5.5 auf Chatbot Arena, SWE‑Bench Pro und großen Codetests.
- Das Modell war nur drei Tage verfügbar, bevor die US‑Regierung Anthropic anwies, es zu deaktivieren.
- GPT 5.5 ist nun standardmäßig das stärkste verfügbare Modell – nicht, weil es Fable 5 überholt hätte.
Abschaltung von Fable 5
Fable 5 wurde nach seinem Start am 9. Juni zum leistungsfähigsten öffentlichen KI‑Modell und überholte GPT 5.5 in wichtigen Benchmarks, bevor die US‑Regierung drei Tage später eingriff.
Das Modell belegte Platz eins auf Chatbot Arena, während GPT 5.5 auf Rang vier lag. In SWE‑Bench Pro erzielte Fable 5 80,3 %, verglichen mit 58,6 % für GPT 5.5 – ein Vorsprung von fast 22 Punkten bei realen Software‑Engineering‑Aufgaben.
Auch in Codetests war der Vorsprung deutlich. Fable 5 erzielte 1.665 Punkte auf Code Arena, 98 Elo‑Punkte mehr als GPT 5.5, und erreichte 29,3 % auf FrontierCode Diamond, wo GPT 5.5 auf 5,7 % kam.
GPT 5.5 hatte einen geringeren Vorteil bei den praktischen Kosten. Es kostet 5 $ pro eine Million Eingabetokens und 30 $ pro eine Million Ausgabetokens, während Fable 5 10 $ bzw. 50 $ kostete und damit für große Nutzungsmengen das günstigere OpenAI‑Modell bot.
Fable 5 bot außerdem ein Kontextfenster von einer Million Tokens und bis zu 128.000 Ausgabetokens. Anthropic hatte es Pro‑, Max‑, Team‑ und Enterprise‑Abonnenten ohne Aufpreis bis zum 22. Juni zur Verfügung gestellt, bevor die Anordnung dieses Zeitfenster vorzeitig beendete.
Also lesen: Is AI Becoming A Real Advantage In Court? Ask The Lawyer Who Just Beat Meta
GPT 5.5 ist der König
Die Abschaltung folgte auf eine Exportkontrollanordnung vom 12. Juni, in der auf eine Jailbreak‑Schwachstelle in Fable 5 und der gesamten Mythos‑5‑Modellfamilie verwiesen wurde. Anthropic widersprach dem Befund und erklärte, das Problem sei geringfügig, bereits bekannt und auch bei GPT 5.5 ohne spezielle Umgehungsmethoden reproduzierbar.
Das Ergebnis ist für den KI‑Markt ungewöhnlich.
Entwickler verloren den Zugriff auf das Modell, das die Benchmark‑Tabellen anführte, während GPT 5.5 zur besten verfügbaren Option wurde, weil sein stärkster Rivale entfernt wurde.
Dieser Unterschied ist besonders für Coding‑Workflows entscheidend. Eine SWE‑Bench‑Pro‑Lücke von 22 Punkten bedeutet den Unterschied zwischen einem Modell, das etwa vier von fünf echten Codebasis‑Problemen lösen kann, und einem, das eher drei von fünf bewältigt.
Der kurze Auftritt von Fable 5 zeigte auch, wie schnell sich die Spitze des Feldes verschieben kann. GPT 5.5 erschien Ende April unter dem internen Codenamen „Spud“, doch seine Führungsphase hielt nur an, bis Anthropic im Juni den öffentlichen Zugang zu einem stärkeren System der Mythos‑Klasse öffnete.
Read Next: Anthropic Refused To Patch Claude Fable's Jailbreak, So The US Banned It, David Sacks Says





