Anthropic's Claude Mythos Preview 和 OpenAI's GPT-5.5 這兩款前沿 AI 模型,在自主網絡任務上的完成速度大幅超出既有能力預測,研究人員於週三表示。
前沿模型超越趨勢
Claude Mythos 預覽版與 GPT-5.5 outperformed 英國 AI Security Institute 自 2024 年底以來追蹤的能力倍增趨勢。
AISI 先前估計,今年稍早時,達到 80% 可靠度的網絡攻擊時間線,大約每五個月就會縮短一半,較 2025 年 11 月的八個月明顯加速。更新版本的 Mythos 預覽版在測試中 solved 了「The Last Ones」——一個 32 步的模擬企業內部網絡攻擊情境——在 10 次嘗試中成功 6 次,並在「Cooling Tower」中取得 10 次中 3 次的成功率。GPT-5.5 在「The Last Ones」中則於 10 次嘗試中成功 3 次。
這是首次有任何模型完成了 AISI 設定的兩個測試範圍。
延伸閱讀: Ripple's Schwartz Says Bitcoin's Mining Model Is The Flaw XRP Avoided
Palo Alto 發出「漏洞末日」警告
Palo Alto Networks 透過自家測試 reported 出了類似結論。
該公司在過去一個月掃描了逾 130 款產品,發現 75 個確實存在的安全漏洞,為平時月度平均數的七倍以上,目前均已完成修補。
公司技術長 Lee Klarich 表示,企業在對手取得類似能力之前,只剩下很短時間的超前空窗期。
他估計,企業「只有大約三到五個月的窄幅時間,可以領先對手一步。」
AISI 也提醒,目前樣本量仍然有限,而難度最高的任務在人類基準數據上也較不足。即便如此,該機構指出,即使從分析中剔除任何一款模型,對於能力「倍增週期」的估算也只會改變不到一個月。專門 tracks 軟體相關 AI 任務的非營利組織 METR,則得到幾乎相同的結論,約為四個月。
能力曲線日益陡峭
Anthropic 上個月限制性地推出早期 Mythos,僅提供給包括 Palo Alto Networks、CrowdStrike、Amazon、Apple 和 JPMorgan 在內的少數合作夥伴。
OpenAI 隨後推出 GPT-5.5-Cyber 模型與 Daybreak 網絡計劃。
在過去 18 個月中,能力變化的速度明顯加快。AISI 於 2026 年 2 月,將其預估的能力倍增週期,從八個月壓縮至 4.7 個月,而在最新一輪測試後,再度下修。重新計算後的數字現已逼近四個月,與 METR 在軟體工程任務上測得的結果大致相符。
下一步閱讀: Coinbase Opens $100K USDC Loans Against Solana Token Holdings





