Anthropic 正準備推出 Claude Opus 4.7,以及一款用於建立網站和簡報的 AI 設計工具,此舉在週一動搖了 Adobe、Wix 和 Figma 的股價。
Opus 4.7 發佈詳情
The Information reported 於 4 月 14 日報道,指兩款產品最快可於本週內推出,消息引述一名知情人士。這款設計工具可接受自然英文提示,同時鎖定開發者與非技術用家。
That puts Anthropic in direct competition with startups like Gamma and Google's Stitch.
Opus 4.7 甚至不是 Anthropic 最先進的模型。
這個稱號屬於 Claude Mythos,一個以網絡安全為重點的系統,公司只透過 Project Glasswing 向部分安全公司提供,並未向公眾開放。
Also Read: World Liberty Financial Demands Insiders Burn 10% Of Their WLFI Or Stay Locked
AI 基準測試危機與 Mythos
OpenAI 最近宣稱領先的編碼基準測試 SWE-bench Verified 已被「污染」,因為發現前沿模型在訓練期間已記住當中的解答,但各實驗室仍在模型比較中引用這些測試。
另一項 ARC-AGI-3 評估則突顯出 AI 系統與人類推理之間的巨大差距。Gemini 得分 0.37%,GPT-5.4 則為 0.26%,而人類表現則為 100%。在 Anthropic 未公開詳盡的模型卡之前,有關 Opus 4.7 提升幅度的說法仍難以被獨立驗證。
英國的 AI Security Institute 最近 evaluated Mythos Preview,發現它可以自主執行高度複雜的網絡攻擊,其成功率前所未見。它成為首個完成「The Last Ones」的 AI——這是一個包含 32 個步驟的企業網絡攻擊模擬,通常需要人類紅隊花費約 20 小時。
Read Next: Binance Launches Built-In Chat Feature To Merge Messaging With Crypto Transfers





