해커들이 가장 원했던 능력 하나만 빼고 모두 돌아온 Fable 5

Anthropic은 Fable 5를 복원했다. 7월 1일부터 전 세계에서 다시 사용할 수 있으며, 기능은 그대로 유지된 채, 문제가 된 해킹 프롬프트를 99% 이상 차단하는 필터가 추가되었다.

핵심 요점:

미국 상무부가 수출 통제를 해제하면서, Fable 5는 Anthropic의 주요 제품 전반에서 전 세계적으로 복귀했다.

모델은 여전히 모든 기능을 유지하지만, 새 필터가 특정 해킹 프롬프트를 감지하면 더 약한 모델로 우회시킨다.

테스트 결과, 더 저렴한 모델들도 같은 취약점을 찾아낼 수 있는 것으로 드러나, Fable 5만을 특별히 위험하다고 보기는 어렵다는 결론이 나왔다.

Fable 5의 글로벌 복귀

미국 상무부는 6월 30일 비상 수출 명령을 해제했다. 이틀 뒤인 7월 1일, 모델은 Claude Platform, Claude.ai, Claude Code, Claude Cowork 전반에서 다시 사용자들에게 제공되기 시작했다. 주요 클라우드 플랫폼을 통한 접근도 뒤이어 재개될 예정이다.

유료 구독자는 7월 7일까지 주간 제한 내에서 Fable 5를 사용할 수 있으며, 이후에는 사용량 기반 크레딧 과금 방식으로 전환된다.

이 모델은 6월 12일부터 중단 상태에 들어갔다. 규제 당국은 모든 외국인이 모델을 사용하는 것을 금지했고, 회사에 약 90분만에 조치를 완료하라고 요구했다. Anthropic은 실시간으로 사용자를 하나씩 가려내는 대신, 모든 사용자에 대해 모델 제공을 중단하는 쪽을 택했다.

이 조치는 Amazon 연구원들이 작성한 보고서 이후 나왔다. 그들은 모델이 여러 공통 시스템의 소프트웨어 취약점 묶음을 표시하도록 유도하는 프롬프트를 발견했다. 한 사례에서는 나아가, 단일 취약점을 어떻게 악용할 수 있는지 보여주는 작동 코드까지 생성했다. 실제 익스플로잇 시연이야말로, 취약점 목록 자체보다 더 큰 경고 신호로 받아들여졌다.

테스트를 통과한 Fable 5

Anthropic은 정부, 그리고 보고서를 제출한 업체와 함께 검토를 진행했으며, 그 결과 훨씬 더 약한 여러 모델이 같은 취약점을 찾아낼 수 있다는 사실을 확인했다. 여기에는 Opus 4.8, GPT-5.5, Kimi K2.7 등이 포함됐다. 팀이 점검한 다른 모든 모델도 그 단 한 번의 익스플로잇 시연을 재현할 수 있었고, 이는 Fable 5만이 특별한 사이버 무기를 가진다고 보기 어렵게 만들었다. 회사는 이 조치를 과도한 대응이라고 비판했었다.

수정 사항은 매우 좁게 설계되었다. 복귀한 Fable 5에는 해당 보고서에 나온 특정 프롬프트를 감지하는 분류기가 추가되었고, 이 프롬프트가 감지되면 더 약한 Opus 4.8로 우회되도록 했다. 그 결과 Fable 5의 능력은 그대로 유지되지만, 일반 코딩에도 과잉 경보가 뜰 수 있으며, 필터가 개입할 때마다 사용자에게 이를 알린다.

Mythos 5는 여전히 제한적

Mythos 5는 동일한 기반 모델이지만 안전장치가 더 적은 버전으로, 여전히 Project Glasswing이라는 프로그램 아래, 심사를 통과한 약 100개 미국 조직에만 제공되고 있다.

회사는 탈옥(jailbreak) 사례를 접수하는 공개 채널도 열었다. 또한 규제 당국에 대해서는 향후 프런티어 모델 출시 전에 더 이른 테스트 접근 권한을 제공하겠다고 약속했다.

Fable 5는 6월 9일, Anthropic의 첫 대중형 Mythos급 모델로 처음 출시됐다. 출시 직후 각종 산업 벤치마크에서 호평을 받았지만, 며칠 만에 사라졌다. 이번 중단은 3주도 채 되지 않았다. 복귀와 함께, 모델이 쉬는 사이 조용히 기준 점수를 차지해 가던 한 중국 연구소의 약진도 다시 견제할 수 있게 됐다.

다음 기사: XRP, 6월 저항에 막힌 불장 속에서 다시 1.07달러 재도전