新聞學習研究排名生態系統

平台現已上線

yellow bottom left star road

Cisco 研究顯示：前沿 AI 模型在多輪攻擊下接連失守

Alexey BondarevMay, 28 2026 9:40

#人工智慧 #思科

Cisco 研究顯示：前沿 AI 模型在多輪攻擊下接連失守

Cisco 的 AI 威脅情報團隊評估了 OpenAI、Anthropic、Google、Amazon 和 xAI 的 15 個封閉旗艦模型，發現多輪攻擊序列的安全繞過率最高可達 88%。

According to the Cisco research blog，這些發現與僅基於單一提示（single-prompt）基準測試所宣稱的安全性相矛盾，研究人員認為這種基準在結構上不足以評估真實世界風險。

Cisco 測試了什麼

團隊設計了將有害請求分散在多輪對話中的攻擊序列，而不是在單一提示中一次性提出。

這種方法利用的是模型處理「情境累積」的方式。

一個模型可能會拒絕明顯有害的單一請求；但當同樣的請求被拆解成一系列漸進步驟，分散在較長的對話中時，同一模型卻可能選擇配合回應。

Cisco 使用這套方法測試了全部 15 個模型，沒有任何一個完全免疫。成功率有所差異，但研究中的每個模型在攻擊複雜度提升到某個門檻後都會失守。

研究人員並未在公開的部落格文章中公布各模型的個別分數，只指出 88% 是研究中觀察到的最高成功率。

背景

自至少 2020 年起，標準的 AI 安全評估多半依賴單輪（single-turn）基準測試。像 MLCommons 這類平台與第三方紅隊通常只送出一個提示，並評估模型是否拒絕回答。這種作法也成為監管討論的基準，包括歐盟《AI 法案》以及美國拜登時期的 AI 安全行政命令，都把此類基準表現視為合規訊號。Cisco 的研究則補充了愈來愈多的證據，質疑靜態基準是否真能反映實際部署情境。

此前 Yellow.com 的一篇報導曾介紹過 (see prior Yellow coverage)，即使安全工具的發展仍落後於模型能力的成長。

研究結果意味著什麼

Cisco 的結果對企業導入 AI 有直接影響。根據供應商公布的安全分數來授權前沿模型的企業，可能正處在一種「以為自己受到保護」的錯覺之中。

這份研究並未主張任何具體的監管措施；研究人員建議，將多輪對話下的對抗性測試納入安全評估的基本要求。

在本報導發佈前，OpenAI、Anthropic 和 Google 尚未就 Cisco 的發現公開回應，也沒有針對這項研究宣布任何修補或模型更新。

Read Next: Anthropic Cofounder Tells Pope AI Models Contain "Unsettling" Hidden Behaviors

免責聲明與風險警告：本文提供的資訊僅供教育與參考用途，並基於作者觀點，不構成財務、投資、法律或稅務建議。加密貨幣資產具有高度波動性並伴隨高風險，包括可能損失全部或大部分投資金額。買賣或持有加密資產可能並不適合所有投資者。本文中所表達的觀點僅代表作者立場，不代表 Yellow、其創辦人或管理層的官方政策或意見。請務必自行進行充分研究（D.Y.O.R.），並在做出任何投資決策前諮詢持牌金融專業人士。

相關新聞

Anthropic 共同創辦人向教宗表示 AI 模型內含「令人不安」的隱藏行為

Anthropic 共同創辦人於梵蒂岡向教宗良十四世表示，研究人員在 AI 模型內發現「令人不安」行為，為 AI 安全辯論加入宗教與倫理視角。

Claude Mythos 與 GPT-5.5 如何悄悄改寫資安防禦的數學規則

Mythos 預覽版與 GPT-5.5 在 AISI 測試中以超出預期的速度完成自動化網路攻擊任務，迫使資安風險與防禦時程全面重估。

GPT-5.5 在 32 步網路攻擊測試中追平 Claude Mythos，英國 AISI 報告

英國 AISI 指出，GPT-5.5 可自主完成 32 步企業網路攻擊模擬，表現追平 Claude Mythos，並突顯高階模型攻擊能力與越獄風險。

GPT-5.5 在 32 步網路攻擊測試中追平 Claude Mythos，英國 AISI 報告

英國 AISI 指出 GPT-5.5 成為第二個能自主完成 32 步企業網路攻擊模擬的模型，在專家級任務通過率、速度與攻擊能力上追平

Discord 群組疑在 Anthropic 發現前已暗用 Claude Mythos 兩週

少數未授權使用者疑透過第三方廠商環境存取 Anthropic 限制版網安模型 Claude Mythos 約兩週，暴露前沿 AI 供應鏈與帳號管理弱點。

相關研究文章

Claude Mythos 與加密貨幣：新一代 AI 威脅對交易意味著什麼

Anthropic 的 Claude Mythos 發現大量零時差漏洞，被認定過於危險而無法公開，迫使加密貨幣產業在 AI 進攻能力激增下加速強化防禦。

AI 驅動的加密貨幣交易：如何將加密新聞轉化為投資策略

AI協助你掌握加密新聞、預測市場反應，並把情緒轉化為交易優勢，助你在市場中領先一步。

AI 代幣復甦：Bittensor 117% 漲勢能否帶動整個板塊回歸？

Bittensor 帶動 AI 代幣強勁反彈，單日板塊飆升 42%，但在 2025 年重挫 75% 後，整體市值仍只是 2024 年高點的一半。

銀行業的 AI 解讀：2030 年真正 AI 支援銀行的可能樣貌

AI 將徹底改變銀行：自主代理系統、勞動力再分配與全新價值，挑戰傳統架構並重塑產業格局。

AI 代幣會成為繼迷因幣之後的下一波加密潮流嗎？

AI 代幣市值在 15 個月內迅速逼近迷因幣，背後有實體算力與機構 ETF 申請支撐；但代理人代幣重挫，泡沫風險升高。

相關學習文章

如何使用 AI 工具進行加密貨幣投資研究：2025 完整指南

AI 推動加密貨幣研究革新，專業交易者與散戶皆能掌握進階策略與風險控管，提升投資成效。

AI強化的加密詐騙：現象解析及避免方法

探討AI強化詐騙、深偽影片、網釣等最新手法，協助投資人辨識危機並保護資產安全。

加密貨幣中AI代理的崛起：金融革命正在展開

AI代理革新加密金融，帶來自動決策與區塊鏈融合，同時也引發市場穩定性和安全、道德議題。

去中心化智慧：AI 與區塊鏈如何重塑科技

AI 與區塊鏈攜手帶來跨產業創新，提升安全性、透明度與自動化，正引領數位科技進入全新時代。

去中心化 AI 能讓你的提示保持隱私嗎？

介紹隱私導向 AI 網路如何透過去中心化節點、密碼學與硬體安全實現「私有推論」，並說明 Venice Token 的網路設計與區塊鏈結算角色。

Cisco 研究顯示：前沿 AI 模型在多輪攻擊下接連失守 | Yellow