Anthropic이 Fable 5를 복구했다는 소식이 7월 1일 전 세계에 전해졌고, 모델은 능력을 온전히 유지한 채, 신고된 해킹 프롬프트를 99% 이상 차단하는 필터를 추가했다.
핵심 요점:
- 미국 상무부가 수출 통제를 해제하면서, Fable 5는 Anthropic의 주요 제품 전반에 걸쳐 전 세계적으로 복귀했다.
- 모델은 모든 기능을 유지하지만, 새 필터가 신고된 특정 해킹 프롬프트를 더 약한 모델로 우회시킨다.
- 테스트 결과, 더 저렴한 모델들도 동일한 취약점을 찾아낼 수 있는 것으로 드러나, Fable 5만을 특별히 위험하다고 보기 어렵게 만들었다.
Fable 5, 전 세계 서비스 재개
미국 상무부는 6월 30일 비상 수출 명령을 해제했다고 발표했고, 이튿날인 7월 1일 모델은 다시 Claude Platform, Claude.ai, Claude Code, Claude Cowork 전반에서 사용자에게 도달했다. 주요 클라우드 플랫폼을 통한 접속도 뒤이어 재개될 예정이다.
유료 구독자는 7월 7일까지 주간 사용 한도 안에서 Fable 5를 사용할 수 있으며, 이후에는 사용량 기반 크레딧 과금 방식으로 전환된다.
모델은 6월 12일에 서비스가 중단되었다. 규제 당국이 모든 외국인의 사용을 금지하고 회사에 약 90분만에 조치를 취하라고 요구하자, Anthropic은 실시간으로 사용자를 하나씩 선별하기보다는 아예 전체 사용자에 대해 모델을 내리는 쪽을 선택했다.
이 조치는 Amazon 연구진이, 모델이 여러 보편적인 시스템에 걸친 소프트웨어 취약점 묶음을 표시하도록 유도하는 프롬프트를 발견한 보고서 이후에 나왔다. 한 번은 더 나아가, 단일 취약점을 어떻게 악용할 수 있는지 보여주는 작동 코드까지 생성했다. 취약점 목록 자체보다 이 단 한 번의 실연이 경보의 직접적인 계기가 되었다.
관련 기사: CrowdStrike, Claude Mythos가 제로데이 의사결정을 가속할 수 있다고 경고
테스트로 무죄를 입증한 Fable 5
정부와 제보 기업과 함께 진행한 Anthropic의 자체 검토는, 훨씬 약한 모델들인 Opus 4.8, GPT-5.5, Kimi K2.7 등이 동일한 취약점을 드러낼 수 있다는 사실을 확인했다. 팀이 점검한 다른 모든 모델 또한 그 단일 익스플로잇 실연을 재현할 수 있었고, 이로 인해 Fable 5만이 독점적인 사이버 무기를 보유하고 있다는 주장은 설득력을 잃었다. 회사는 당시 금지 조치를 과도하다고 비판했었다.
수정은 매우 좁은 범위에 그쳤다. 복귀한 모델에는 신고된 해당 프롬프트를 포착해 더 약한 Opus 4.8로 우회시키는 단일 분류기가 붙었고, 이로써 Fable 5의 원래 능력은 그대로 두되, 평범한 코딩에도 오탐 경보를 띄우고 개입 시마다 사용자에게 이를 알리도록 했다.
Mythos 5는 여전히 제한적
Mythos 5는 같은 기반 모델에 더 적은 안전장치를 둔 버전으로, 여전히 Project Glasswing이라는 프로그램을 통해 심사된 미국 내 약 100개 기관에만 울타리 안에서 제공된다.
회사는 탈옥(jailbreak) 시도를 신고할 수 있는 공공 채널도 개설했다. 또한 향후 프런티어 모델 출시 전에 규제 당국이 더 일찍 테스트할 수 있도록 접근 권한을 제공하겠다고 약속했다.
Fable 5는 6월 9일 Anthropic의 첫 대중용 Mythos급 모델로 출시되었으며, 출시 직후 각종 산업 벤치마크에서 호평을 받았지만 며칠 만에 사라졌다. 이번 중단은 3주가 채 되지 않았다. 이번 복귀로, 모델이 멈춰 있는 사이 조용히 치고 올라온 중국 신생 연구소가 잠시 차지했던 벤치마크 우위를 되찾게 됐다.





