Yellow.com

Anthropic's Claude Mythos Preview 和 OpenAI's GPT-5.5 這兩款尖端 AI 模型，在自動化網路任務中的表現遠超既有能力預測，研究人員於週三表示。

尖端模型超越成長趨勢

Claude Mythos 預覽版與 GPT-5.5 的表現 outperformed 了英國 AI Security Institute 自 2024 年底起所追蹤的能力「倍增趨勢」。

AISI 先前估計，今年稍早時「達到 80% 可靠度的網攻時間門檻」大約每五個月就會縮短一半，而 2025 年 11 月時還是約八個月。新版的 Mythos 預覽檢測點 solved 了「The Last Ones」這個 32 步驟的模擬企業網路攻擊，在 10 次嘗試中成功 6 次，並在「Cooling Tower」中 10 次嘗試成功 3 次。GPT-5.5 則在「The Last Ones」中 10 次嘗試成功 3 次。

這是首次有任何模型完成 AISI 兩個難度區間的任務。

延伸閱讀： Ripple's Schwartz Says Bitcoin's Mining Model Is The Flaw XRP Avoided

Palo Alto 發出「漏洞末日」警訊

Palo Alto Networks 透過自家測試 reported 出了類似的結論。

該公司在過去一個月掃描了逾 130 項產品，發現 75 個確實存在的漏洞，數量是其一般月度平均的七倍以上，目前皆已完成修補。

該公司技術長 Lee Klarich 表示，企業在對手獲得類似能力之前，只剩下非常有限的時間窗口。

他估計，企業「只剩下約三到五個月的窄幅時間窗口，能在能力上領先攻擊者」。

AISI 也提醒，目前樣本規模仍偏小，且最困難任務在人類表現上的比較資料有限。即便如此，該機構指出，即使將任何一個單一模型排除在分析之外，估算出的「倍增期」也只會相差不到一個月。負責在軟體任務上 tracks AI 表現的非營利組織 METR，也得出幾乎相同、約四個月的數字。

能力曲線急遽增陡

Anthropic 上個月僅將 Mythos 早期版本限量提供給少數夥伴，包括 Palo Alto Networks、CrowdStrike、Amazon、Apple 與 JPMorgan 等。

OpenAI 隨後推出 GPT-5.5-Cyber 模型，以及名為 Daybreak 的網安計畫。

在過去 18 個月中，能力變化的速度明顯加快。AISI 先是在 2026 年 2 月，將其預測的能力倍增期由八個月壓縮到 4.7 個月，並在本輪測試後再次下修。重新計算後的數字如今更接近四個月，與 METR 對軟體工程任務的觀察相呼應。

下一篇閱讀： Coinbase Opens $100K USDC Loans Against Solana Token Holdings

Alexey Bondarev

Alexey Bondarev 是 Yellow.com 的內容總監，過去 10 年持續報導加密貨幣領域。他專長於撰寫深入的 Research 和 Learn 類型文章，特別關注分析式報導、產業脈絡，以及塑造加密貨幣世界的更大力量，從 AI 時代與資安技術到金融科技創新。他相信數位的一切即將全面超越類比的一切，並正為實現這一願景而全力以赴。

Claude Mythos 與 GPT-5.5 如何悄悄改寫資安防禦的數學規則

尖端模型超越成長趨勢

Palo Alto 發出「漏洞末日」警訊

能力曲線急遽增陡

Alexey Bondarev