Anthropic 在全球恢復 Fable 5,自 7 月 1 日起重新上線,能力完整保留,同時加入一個過濾器,在超過 99% 的嘗試中攔截一個被標記的駭客提示。
重點摘要:
- 美國商務部解除出口管制,Fable 5 重新在 Anthropic 的主要產品中於全球上線。
- 模型保留全部能力,不過新過濾器會將一個被標記的駭客提示改導到較弱的模型。
- 測試顯示較便宜的模型也能找到相同漏洞,削弱了將 Fable 5 視為「獨一無二的危險」的理由。
Fable 5 重返全球
美國商務部在 6 月 30 日解除緊急出口命令,隔日模型就重新在 Claude Platform、Claude.ai、Claude Code 和 Claude Cowork 上向用戶開放。透過各大雲端平台的存取將隨後跟進。
付費訂閱用戶可在 7 月 7 日前於每週配額內使用,之後若要持續使用,將改採依用量計費的點數制度。
模型自 6 月 12 日起下線。監管機構禁止所有外國人士接觸該模型,並只給公司約 90 分鐘的時間遵守。Anthropic 因無法在實務上即時逐一篩選使用者,只能選擇對所有用戶暫時下架。
這道指令源自一份報告:Amazon 研究人員發現一個提示,能引導模型標記常見系統中的一串軟體漏洞。在其中一次實驗中,模型更進一步產出可行的程式碼,展示如何利用其中一個漏洞。引發警報的,正是這段示範程式碼,而不只是漏洞清單。
延伸閱讀:CrowdStrike 警告 Claude Mythos 恐加速零時差決策
測試為 Fable 5 解套
Anthropic 與政府及提交報告的公司同步進行的內部審查確認,多個更弱的模型同樣能挖出這些漏洞,包括 Opus 4.8、GPT-5.5 和 Kimi K2.7。團隊檢測的其他模型也都能重現那次唯一的攻擊示範,這讓「只有 Fable 5 掌握獨特網路武器」的說法站不住腳。公司早前已批評這項禁令是過度擴權。
修正本身相當針對性。模型回歸後掛上一個分類器,專門攔截該通報的提示,並將之改導給較弱的 Opus 4.8 處理,既保留 Fable 5 的能力,又導致一般寫程式時可能出現更多誤報,且在每次介入時提醒使用者。
Mythos 5 仍受限
Mythos 5,即同一底層模型但防護較少的版本,依舊僅在名為「Project Glasswing」的計畫下,開放給約 100 家經審核的美國機構使用。
公司也開放了一個公開管道,供外界通報越獄(jailbreak)案例,並承諾未來在新一代前沿模型推出前,讓監管機構更早取得測試權限。
Fable 5 首度於 6 月 9 日推出,身為 Anthropic 首款廣泛公開的 Mythos 級模型,在多項產業評測中獲得好評,卻在上線數日內即被下架。這次停擺僅持續了不到三週。它的回歸,重新奪回了在多項指標上被一間快速崛起的中國實驗室悄悄超車的領先地位。





