Anthropic 在 7 月 1 日於全球恢復上線 Fable 5, 並完整保留其功能,同時新增一個過濾器,能在逾 99% 的嘗試中攔截被標記的駭客提示。
重點整理:
- 美國商務部解除出口管制,Fable 5 在 Anthropic 的主要產品中重新於全球上線。
- 模型保留全部能力,但新增的過濾器會將某個被標記的駭客提示改導至較弱的模型。
- 測試顯示,更便宜的模型同樣能找出相同漏洞,削弱了把 Fable 5 視為「特別危險」的理由。
Fable 5 全球回歸
美國商務部在 6 月 30 日解除 緊急出口命令,隔日模型便再次在 Claude Platform、Claude.ai、Claude Code 以及 Claude Cowork 等服務上線,重新觸及用戶。透過各大雲端平台的存取也將隨後恢復。
付費訂閱戶可在 7 月 7 日前,於每週額度內使用 Fable 5;之後若要持續存取,將改以按量計費的使用點數制度。
模型在 6 月 12 日起全面下線。監管機構禁止所有外國人接觸該模型,並僅給公司約 90 分鐘時間配合; Anthropic 因無法即時逐一篩選用戶,因此選擇直接對所有人下架模型。
該指令源於一份報告:Amazon 研究人員發現 一個提示,能誘導模型標示出常見系統中一簇軟件漏洞。 在其中一次測試中,模型更進一步產出可用程式碼,展示如何利用其中一項漏洞。 引發警報的關鍵,與其說是漏洞清單,不如說是那次成功示範的攻擊程式。
延伸閱讀:CrowdStrike 警告 Claude Mythos 或加速零日攻擊決策
測試為 Fable 5 洗脫嫌疑
Anthropic 自行進行的審查(與政府及提交報告的公司並行)證實, 許多弱得多的模型同樣能發掘這些漏洞,其中包括 Opus 4.8、GPT-5.5 與 Kimi K2.7。 團隊檢測的所有其他模型也都能重現那次唯一的攻擊示範, 這削弱了「只有 Fable 5 掌握獨一無二網攻武器」的說法。公司曾形容該禁令是過度延伸。
修正措施相當聚焦。模型重返上線後,多了一個分類器,專門攔截該則被通報的提示, 並將之改導 至較弱的 Opus 4.8。這保留 Fable 5 的完整能力,但會在一般寫程式請求上提高誤判率, 並在每次介入時向用戶發出警示。
Mythos 5 仍維持嚴格限制
Mythos 5 是同一底層模型、但防護較少的版本, 目前仍只在名為 Project Glasswing 的計劃下, 對大約 100 間經審核的美國機構開放,處於嚴格圍籬之中。
公司同時開放了公眾通報 jailbreak(越獄提示)的管道, 並承諾未來在推出新一代前沿模型前,將讓監管機構更早取得測試權限。
Fable 5 最初於 6 月 9 日推出,是 Anthropic 首款廣泛開放的 Mythos 級模型, 在多項產業評測中獲得好評,卻在發佈數日內突然下架。這次停擺僅維持約三週。 它的回歸,重新奪回了在基準測試上的領先地位——而這段期間,一家快速崛起的中國實驗室曾悄悄把持了該優勢。





