Anthropic 正準備推出 Claude Opus 4.7,以及一款以 AI 驅動、用於建立網站和簡報的設計工具,此舉在週一動搖了 Adobe、Wix 和 Figma 的股價。
Opus 4.7 發布細節
The Information 在 4 月 14 日的 報導 中引述知情人士消息稱,這兩款產品最快可能於本週就會發佈。該設計工具可接受自然英文提示,目標使用者同時包括開發者與非技術背景的使用者。
這一動作讓 Anthropic 直接與 Gamma 等新創公司以及 Google 的 Stitch 展開正面競爭。
Opus 4.7 甚至還不是 Anthropic 最先進的模型。
這項頭銜屬於 Claude Mythos,一款專注網路安全的系統。公司正透過 Project Glasswing 僅向特定資安公司提供該模型,同時仍將其與一般大眾隔離。
延伸閱讀: World Liberty Financial Demands Insiders Burn 10% Of Their WLFI Or Stay Locked
AI 基準測試危機與 Mythos
OpenAI 近日宣稱頂尖程式碼基準測試 SWE-bench Verified 已遭「汙染」,因發現前沿模型在訓練期間記住了該測試的解答。然而各實驗室在比較模型時,仍持續引用這些測試結果。
另一項 ARC-AGI-3 評估則凸顯 AI 系統與人類推理能力之間的巨大差距。Gemini 僅拿到 0.37%,GPT-5.4 則為 0.26%,而人類得分為 100%。在 Anthropic 尚未提供詳細模型卡之前,外界難以獨立驗證關於 Opus 4.7 性能提升的相關說法。
英國的 AI Security Institute 近期評估了 Mythos Preview,發現它能以自動化方式執行高度複雜的網路攻擊,其成功率遠超其他模型。它成為首個完成「The Last Ones」的 AI——這是一項 32 步驟的企業網路攻擊模擬,人類紅隊通常需要花費 20 小時才能完成。
下一步閱讀: Binance Launches Built-In Chat Feature To Merge Messaging With Crypto Transfers






