Claude Mythos 與 GPT-5.5 如何悄悄改寫資安防禦的數學規則

Claude Mythos 與 GPT-5.5 如何悄悄改寫資安防禦的數學規則

Anthropic's Claude Mythos PreviewOpenAI's GPT-5.5 這兩款尖端 AI 模型,在自動化網路任務中的表現遠超既有能力預測,研究人員於週三表示。

尖端模型超越成長趨勢

Claude Mythos 預覽版與 GPT-5.5 的表現 outperformed 了英國 AI Security Institute 自 2024 年底起所追蹤的能力「倍增趨勢」。

AISI 先前估計,今年稍早時「達到 80% 可靠度的網攻時間門檻」大約每五個月就會縮短一半,而 2025 年 11 月時還是約八個月。新版的 Mythos 預覽檢測點 solved 了「The Last Ones」這個 32 步驟的模擬企業網路攻擊,在 10 次嘗試中成功 6 次,並在「Cooling Tower」中 10 次嘗試成功 3 次。GPT-5.5 則在「The Last Ones」中 10 次嘗試成功 3 次。

這是首次有任何模型完成 AISI 兩個難度區間的任務。

延伸閱讀: Ripple's Schwartz Says Bitcoin's Mining Model Is The Flaw XRP Avoided

Palo Alto 發出「漏洞末日」警訊

Palo Alto Networks 透過自家測試 reported 出了類似的結論。

該公司在過去一個月掃描了逾 130 項產品,發現 75 個確實存在的漏洞,數量是其一般月度平均的七倍以上,目前皆已完成修補。

該公司技術長 Lee Klarich 表示,企業在對手獲得類似能力之前,只剩下非常有限的時間窗口。

他估計,企業「只剩下約三到五個月的窄幅時間窗口,能在能力上領先攻擊者」。

AISI 也提醒,目前樣本規模仍偏小,且最困難任務在人類表現上的比較資料有限。即便如此,該機構指出,即使將任何一個單一模型排除在分析之外,估算出的「倍增期」也只會相差不到一個月。負責在軟體任務上 tracks AI 表現的非營利組織 METR,也得出幾乎相同、約四個月的數字。

能力曲線急遽增陡

Anthropic 上個月僅將 Mythos 早期版本限量提供給少數夥伴,包括 Palo Alto Networks、CrowdStrikeAmazonAppleJPMorgan 等。

OpenAI 隨後推出 GPT-5.5-Cyber 模型,以及名為 Daybreak 的網安計畫。

在過去 18 個月中,能力變化的速度明顯加快。AISI 先是在 2026 年 2 月,將其預測的能力倍增期由八個月壓縮到 4.7 個月,並在本輪測試後再次下修。重新計算後的數字如今更接近四個月,與 METR 對軟體工程任務的觀察相呼應。

下一篇閱讀: Coinbase Opens $100K USDC Loans Against Solana Token Holdings

免責聲明與風險警告: 本文提供的資訊僅供教育與參考用途,並基於作者觀點,不構成財務、投資、法律或稅務建議。 加密貨幣資產具有高度波動性並伴隨高風險,包括可能損失全部或大部分投資金額。買賣或持有加密資產可能並不適合所有投資者。 本文中所表達的觀點僅代表作者立場,不代表 Yellow、其創辦人或管理層的官方政策或意見。 請務必自行進行充分研究(D.Y.O.R.),並在做出任何投資決策前諮詢持牌金融專業人士。
Claude Mythos 與 GPT-5.5 如何悄悄改寫資安防禦的數學規則 | Yellow.com