Anthropic 正準備推出 Claude Opus 4.7,以及一款由 AI 驅動、可用來建立網站和簡報的設計工具,此舉在週一震動了 Adobe、Wix 和 Figma 的股價。
Opus 4.7 發佈詳情
The Information reported 指出,根據一名知情人士透露,這兩款產品最快可能在 4 月 14 日當週內推出。該設計工具支援以自然英文下達指令,目標使用者同時涵蓋開發者與非技術背景的使用者。
這也 puts Anthropic 直接與 Gamma 等新創公司,以及 Google 的 Stitch 展開競爭。
但 Opus 4.7 甚至還不是 Anthropic 最先進的模型。
這個頭銜屬於 Claude Mythos,一款專注網絡安全的系統。公司目前只透過 Project Glasswing 分發給少數資安公司,並未向一般大眾開放。
Also Read: World Liberty Financial Demands Insiders Burn 10% Of Their WLFI Or Stay Locked
AI 基準測試危機與 Mythos
OpenAI 近期宣稱,領先的程式碼基準測試 SWE-bench Verified 已被「污染」,因為發現多個前沿模型在訓練期間記住了其解答。但各實驗室在進行模型比較時,仍持續引用同一批測試結果。
另一項 ARC-AGI-3 評估則突顯了 AI 系統與人類推理能力之間的巨大差距。Gemini 僅獲得 0.37% 分數、GPT-5.4 則是 0.26%,而人類得分為 100%。在 Anthropic 尚未公開詳細的模型說明文件之前,外界難以獨立驗證 Opus 4.7 在效能上的實際提升。
英國的 AI Security Institute 近期 evaluated Mythos Preview,發現它能以自動化方式發動高度複雜的網絡攻擊,其成功率遠超其他模型。Mythos 也成為首個完成「The Last Ones」測試的 AI——這是一個包含 32 個步驟的企業網絡攻擊模擬,一般人類紅隊通常需要耗費約 20 小時才能完成。
Read Next: Binance Launches Built-In Chat Feature To Merge Messaging With Crypto Transfers






