Fable 5 強勢回歸 唯獨缺少駭客最想要的那種力量

Fable 5 強勢回歸 唯獨缺少駭客最想要的那種力量

Anthropic 在 7 月 1 日於全球恢復上線 Fable 5, 並完整保留其功能,同時新增一個過濾器,能在逾 99% 的嘗試中攔截被標記的駭客提示。

重點整理:

  • 美國商務部解除出口管制,Fable 5 在 Anthropic 的主要產品中重新於全球上線。
  • 模型保留全部能力,但新增的過濾器會將某個被標記的駭客提示改導至較弱的模型。
  • 測試顯示,更便宜的模型同樣能找出相同漏洞,削弱了把 Fable 5 視為「特別危險」的理由。

Fable 5 全球回歸

美國商務部在 6 月 30 日解除 緊急出口命令,隔日模型便再次在 Claude Platform、Claude.ai、Claude Code 以及 Claude Cowork 等服務上線,重新觸及用戶。透過各大雲端平台的存取也將隨後恢復。

付費訂閱戶可在 7 月 7 日前,於每週額度內使用 Fable 5;之後若要持續存取,將改以按量計費的使用點數制度。

模型在 6 月 12 日起全面下線。監管機構禁止所有外國人接觸該模型,並僅給公司約 90 分鐘時間配合; Anthropic 因無法即時逐一篩選用戶,因此選擇直接對所有人下架模型。

該指令源於一份報告:Amazon 研究人員發現 一個提示,能誘導模型標示出常見系統中一簇軟件漏洞。 在其中一次測試中,模型更進一步產出可用程式碼,展示如何利用其中一項漏洞。 引發警報的關鍵,與其說是漏洞清單,不如說是那次成功示範的攻擊程式。

延伸閱讀:CrowdStrike 警告 Claude Mythos 或加速零日攻擊決策

測試為 Fable 5 洗脫嫌疑

Anthropic 自行進行的審查(與政府及提交報告的公司並行)證實, 許多弱得多的模型同樣能發掘這些漏洞,其中包括 Opus 4.8、GPT-5.5 與 Kimi K2.7。 團隊檢測的所有其他模型也都能重現那次唯一的攻擊示範, 這削弱了「只有 Fable 5 掌握獨一無二網攻武器」的說法。公司曾形容該禁令是過度延伸。

修正措施相當聚焦。模型重返上線後,多了一個分類器,專門攔截該則被通報的提示, 並將之改導 至較弱的 Opus 4.8。這保留 Fable 5 的完整能力,但會在一般寫程式請求上提高誤判率, 並在每次介入時向用戶發出警示。

Mythos 5 仍維持嚴格限制

Mythos 5 是同一底層模型、但防護較少的版本, 目前仍只在名為 Project Glasswing 的計劃下, 對大約 100 間經審核的美國機構開放,處於嚴格圍籬之中。

公司同時開放了公眾通報 jailbreak(越獄提示)的管道, 並承諾未來在推出新一代前沿模型前,將讓監管機構更早取得測試權限。

Fable 5 最初於 6 月 9 日推出,是 Anthropic 首款廣泛開放的 Mythos 級模型, 在多項產業評測中獲得好評,卻在發佈數日內突然下架。這次停擺僅維持約三週。 它的回歸,重新奪回了在基準測試上的領先地位——而這段期間,一家快速崛起的中國實驗室曾悄悄把持了該優勢。

下一篇:XRP 再度測試 1.07 美元關口 6 月多次受阻陰影籠罩多頭

免責聲明及風險提示: 本文資訊僅供教育與參考之用,並基於作者意見,並不構成金融、投資、法律或稅務建議。 加密貨幣資產具高度波動性並伴隨高風險,可能導致投資大幅虧損或全部損失,並非適合所有投資者。 文章內容僅代表作者觀點,不代表 Yellow、創辦人或管理層立場。 投資前請務必自行徹底研究(D.Y.O.R.),並諮詢持牌金融專業人士。
Fable 5 強勢回歸 唯獨缺少駭客最想要的那種力量 | Yellow.com