Anthropic’s Fable 5는 6월 12일 U.S. export control directive took it offline로 내려가기 전까지 주요 AI 벤치마크 전반에서 OpenAI’s GPT 5.5를 잠시 능가했습니다.
Key Points:
- Fable 5는 Arena, SWE-Bench Pro 및 주요 코딩 테스트에서 GPT 5.5를 앞섰습니다.
- 이 모델은 미국 정부가 Anthropic에 비활성화를 명령하기 전 단 3일만 공개되었습니다.
- 현재 GPT 5.5가 Fable 5를 이겨서가 아니라, 사용 가능한 모델 중 가장 강력한 기본 옵션이 되었습니다.
Fable 5 Shut Down
Fable 5는 6월 9일 출시 이후 became 가장 능력 있는 공개 AI 모델로 떠오르며, 미국 정부가 3일 뒤에 개입하기 전까지 주요 벤치마크에서 GPT 5.5를 제쳤습니다.
이 모델은 Arena 순위에서 1위를 기록했고, GPT 5.5는 4위였습니다. SWE-Bench Pro에서는 Fable 5가 80.3%를 기록한 반면 GPT 5.5는 58.6%에 그쳐, 실제 소프트웨어 엔지니어링 작업에서 약 22포인트의 격차가 났습니다.
우위는 코딩 테스트에서도 분명했습니다. Fable 5는 Code Arena에서 1,665점을 기록해 GPT 5.5보다 Elo 98점 높았고, FrontierCode Diamond에서는 29.3%를 달성한 반면 GPT 5.5는 5.7%에 머물렀습니다.
GPT 5.5는 실사용 가격 면에서 한 가지 좁은 우위를 지녔습니다. 백만 입력 토큰당 5달러, 백만 출력 토큰당 30달러인 반면, Fable 5는 각각 10달러와 50달러여서 대량 사용 시 OpenAI 모델이 더 저렴했습니다.
Fable 5는 백만 토큰 컨텍스트 윈도와 128,000 출력 토큰도 제공했습니다. Anthropic은 6월 22일까지 Pro, Max, Team, Enterprise 구독자에게 추가 비용 없이 제공할 계획이었으나, 정부 명령으로 이 기간이 조기에 종료됐습니다.
Also Read: Is AI Becoming A Real Advantage In Court? Ask The Lawyer Who Just Beat Meta
GPT 5.5 Is The King
서비스 중단은 Fable 5와 더 넓은 Mythos 5 모델 계열의 탈옥(jailbreak) 취약점을 언급한 6월 12일 수출 통제 명령 이후에 이뤄졌습니다. Anthropic은 이 평가에 이견을 제기하며, 문제가 경미하고 이미 알려져 있었으며, 특별한 우회 방법 없이 GPT 5.5에서도 재현 가능하다고 밝혔습니다.
이는 AI 시장에서 이례적인 결과입니다.
개발자들은 벤치마크 상위권을 차지하던 모델에 대한 접근 권한을 잃었고, GPT 5.5는 가장 가까운 경쟁자가 퇴출되면서 최고의 선택지로 남게 됐습니다.
이 차이는 특히 코딩 워크플로에서 중요합니다. SWE-Bench Pro에서 22포인트 격차는 실제 코드베이스 이슈 다섯 개 중 약 네 개를 해결하는 모델과 세 개 정도만 처리하는 모델의 차이를 의미합니다.
Fable 5의 짧은 활약은 최전선 모델 성능이 얼마나 빠르게 변할 수 있는지도 보여줍니다. GPT 5.5는 내부 코드명 “Spud”로 4월 말에 출시됐지만, Anthropic이 더 강력한 Mythos급 시스템을 6월에 공개 접근으로 열자 그 우위는 오래가지 못했습니다.
Read Next: Anthropic Refused To Patch Claude Fable's Jailbreak, So The US Banned It, David Sacks Says





