Anthropic กำลังเตรียมเปิดตัว Claude Opus 4.7 และเครื่องมือออกแบบที่ขับเคลื่อนด้วย AI สำหรับสร้างเว็บไซต์และงานพรีเซนเทชัน ซึ่งทำให้ราคาหุ้นของ Adobe, Wix และ Figma ผันผวนในวันจันทร์
รายละเอียดการเปิดตัว Opus 4.7
The Information reported เมื่อวันที่ 14 เม.ย. ว่าทั้งสองผลิตภัณฑ์อาจเปิดตัวได้เร็วสุดภายในสัปดาห์นี้ โดยอ้างอิงแหล่งข่าวที่รู้แผน เครื่องมือออกแบบนี้รับพรอมต์ภาษาอังกฤษธรรมดา และเจาะกลุ่มทั้งนักพัฒนาและผู้ใช้ที่ไม่ใช่สายเทคนิค
เรื่องนี้ puts Anthropic เข้าสู่การแข่งขันโดยตรงกับสตาร์ทอัพอย่าง Gamma และ Google's Stitch
Opus 4.7 ยังไม่ใช่โมเดลที่ล้ำหน้าที่สุดของ Anthropic
ตำแหน่งนั้นเป็นของ Claude Mythos, a cybersecurity-focused system ที่บริษัทแจกจ่ายให้เฉพาะบริษัทด้านความปลอดภัยบางรายผ่าน Project Glasswing และยังไม่เปิดให้สาธารณะใช้งาน
Also Read: World Liberty Financial Demands Insiders Burn 10% Of Their WLFI Or Stay Locked
วิกฤตเกณฑ์ชี้วัด AI และ Mythos
OpenAI เพิ่งประกาศว่า SWE-bench Verified ซึ่งเป็นเบนช์มาร์กด้านโค้ดชั้นนำถูกมองว่า “contaminated” หลังพบว่าโมเดลระดับแนวหน้าจดจำคำตอบในชุดทดสอบระหว่างการเทรน อย่างไรก็ตาม ห้องปฏิบัติการต่าง ๆ ยังคงอ้างอิงการทดสอบชุดเดิมในการเปรียบเทียบโมเดล
การประเมินอีกชุดหนึ่ง ARC-AGI-3 เน้นให้เห็นช่องว่างระหว่างระบบ AI กับการให้เหตุผลแบบมนุษย์ Gemini ทำคะแนนได้ 0.37% และ GPT-5.4 ทำได้ 0.26% ในขณะที่มนุษย์ทำได้ 100% โดยที่ยังไม่มีโมเดลการ์ดละเอียดจาก Anthropic การอ้างถึงพัฒนาการของ Opus 4.7 จึงยังตรวจสอบได้อย่างอิสระค่อนข้างยาก
สถาบัน AI Security Institute ของสหราชอาณาจักรเพิ่ง evaluated Mythos Preview และพบว่าสามารถดำเนินการโจมตีไซเบอร์ที่ซับซ้อนได้โดยอัตโนมัติในอัตราที่ไม่มีโมเดลใดเทียบได้ กลายเป็น AI ตัวแรกที่ทำภารกิจ “The Last Ones” สำเร็จ ซึ่งเป็นการจำลองการโจมตีเครือข่ายองค์กรแบบ 32 ขั้นตอนที่โดยปกติต้องใช้เวลาทีมเรดทีมมนุษย์ประมาณ 20 ชั่วโมง
Read Next: Binance Launches Built-In Chat Feature To Merge Messaging With Crypto Transfers





