Claude Mythos แก้แฮ็ก AISI แบบ 32 ขั้นตอนสำเร็จ 6 จาก 10 ครั้ง

profile-steven-zeiler
Steven Zeiler1 ชั่วโมงที่แล้ว
Claude Mythos แก้แฮ็ก AISI แบบ 32 ขั้นตอนสำเร็จ 6 จาก 10 ครั้ง

เช็กพอยต์ใหม่ของ Anthropic's Claude Mythos Preview กลายเป็นโมเดล AI แรกที่ผ่านการจำลองการโจมตีไซเบอร์ของรัฐบาลสหราชอาณาจักรทั้งสองแบบ ทำให้เกิดคำถามใหม่เกี่ยวกับการแฮ็กแบบอัตโนมัติ

AISI รายงานความก้าวหน้าของ Mythos

AI Security Institute ของสหราชอาณาจักร รายงาน เมื่อวันพุธว่าเช็กพอยต์ Mythos รุ่นใหม่สามารถทำภารกิจโจมตีเครือข่ายองค์กรแบบ 32 ขั้นตอน ในเรนจ์ชื่อ "The Last Ones" สำเร็จ 6 จาก 10 ครั้ง ขณะที่เวอร์ชันก่อนหน้าทำได้เพียง 3 จาก 10 ครั้ง

โมเดลที่อัปเดตแล้วยังสามารถผ่าน "Cooling Tower" ซึ่งเป็นเรนจ์ระบบควบคุมอุตสาหกรรมที่ไม่เคยมีโมเดลใดทำสำเร็จมาก่อน ด้วยอัตรา 3 จาก 10 ครั้ง

โมเดลคู่แข่งอย่าง OpenAI GPT-5.5 ถูกทดสอบกับแบบฝึกเดียวกัน โดย ทำสำเร็จ "The Last Ones" ได้ 3 จาก 10 ครั้ง แต่ไม่สามารถผ่าน "Cooling Tower" ได้

AISI รันเรนจ์ด้วยเพดานคอมพิวต์ 100 ล้านโทเคนต่อหนึ่งครั้งทดสอบ และหน่วยงานระบุว่าประสิทธิภาพยังคงสเกลขึ้นเรื่อยๆ ที่เพดานดังกล่าว แสดงให้เห็นว่างบคอมพิวต์ที่สูงกว่านี้น่าจะเพิ่มอัตราความสำเร็จได้อีก

Also Read: Southeast Asia Blockchain Week Brings Ripple, Avalanche, Solana Foundation, And K-Pop To Bangkok

เวลาการเพิ่มขีดความสามารถหดสั้นลงเรื่อยๆ

AISI ติดตามพัฒนาการด้านไซเบอร์ผ่านตัวชี้วัด time horizon โดยวัดว่าระบบสามารถทำภารกิจอัตโนมัติหนึ่งงานให้สำเร็จด้วยความน่าเชื่อถือ 80% ภายในเวลานานเท่าไร ในเดือนพฤศจิกายน 2025 หน่วยงานได้ ประเมิน ว่าเวลาการเพิ่มขีดความสามารถ (doubling time) อยู่ที่ 8 เดือน ภายในกุมภาพันธ์ 2026 ตัวเลขนี้หดเหลือ 4.7 เดือน และทั้ง Mythos กับ GPT-5.5 ก็ทำผลงานแซงเทรนด์ที่เร็วขึ้นนี้ไปแล้ว

หน่วยงานยอมรับว่ายังไม่แน่ชัดว่าผลลัพธ์ล่าสุดสะท้อนการเร่งตัวรอบใหม่ หรือเป็นเพียงการกระโดดครั้งเดียว

องค์กรวิจัยไม่แสวงกำไร METR ซึ่งติดตามความสามารถของ AI ในงานซอฟต์แวร์แทนที่จะเป็นไซเบอร์เรนจ์ ให้ค่าที่ใกล้เคียงกันราว 4.2 เดือน AISI ระบุว่าการที่ตัวเลขเริ่มบรรจบกันช่วยเสริมความเชื่อว่าเทรนด์นี้สะท้อนการเพิ่มขีดความสามารถจริง ไม่ใช่เพียงความลำเอียงของชุดประเมินผลชุดเดียว

สถาบันย้ำว่าเรนจ์ของตนไม่มีผู้ป้องกันเชิงรุกอยู่ในระบบ ดังนั้นผลลัพธ์จึงแสดงให้เห็นสิ่งที่โมเดลทำได้กับเครือข่ายที่ป้องกันอย่างอ่อนแอ มากกว่าจะเป็นระบบองค์กรที่แข็งแกร่งในโลกจริง

ทำไมการกระโดดด้านขีดความสามารถจึงสำคัญ

เช็กพอยต์ Mythos รุ่นใหม่นี้ไม่ได้มาพร้อมการปล่อยโมเดลเวอร์ชันใหญ่ใหม่ AISI ใช้เวอร์ชันเดียวกับที่ Anthropic นำไปใช้เมื่อเดือนที่แล้วกับ Project Glasswing โปรแกรมพันธมิตรด้านความปลอดภัย หลังจากได้รับบิลด์อัปเดตของโมเดลตัวเดิม

"การกระโดดด้านขีดความสามารถที่น่าสนใจไม่ได้จำเป็นต้องมาพร้อมการปล่อยโมเดลใหม่เสมอไป" สถาบันเขียนไว้ ซึ่งขัดกับสมมติฐานที่ว่าฝ่ายป้องกันสามารถวางแผนตามรอบการปล่อยโมเดลได้

Anthropic เปิดตัว Mythos Preview เมื่อวันที่ 7 เม.ย. โดยมองว่าโมเดลนี้เป็นจุดเปลี่ยนของอุตสาหกรรมความปลอดภัย หลังจากสามารถค้นหาช่องโหว่ zero-day ในระบบปฏิบัติการหลักๆ และเบราว์เซอร์หลากหลายตัวในการทดสอบภายใน บริษัทระบุว่า ได้ชะลอการปล่อยใช้งานวงกว้าง เพราะขีดความสามารถดังกล่าว และการประเมินก่อนหน้านี้ของ AISI ในเดือนเมษายนก็ชี้ว่า Mythos เป็นก้าวกระโดดที่ชัดเจนจากระบบแนวหน้ารุ่นก่อนๆ

Read Next: Gemini Space Station Hit By Multiple Securities Fraud Claims After IPO

ข้อจำกัดความรับผิดชอบและคำเตือนความเสี่ยง: ข้อมูลที่ให้ไว้ในบทความนี้มีไว้เพื่อการศึกษาและการให้ข้อมูลเท่านั้น และอิงตามความเห็นของผู้เขียน ไม่ถือเป็นคำแนะนำทางการเงิน การลงทุน กฎหมาย หรือภาษี สินทรัพย์คริปโตมีความผันผวนสูงและมีความเสี่ยงสูง รวมถึงความเสี่ยงในการสูญเสียเงินลงทุนทั้งหมดหรือส่วนใหญ่ การซื้อขายหรือการถือครองสินทรัพย์คริปโตอาจไม่เหมาะสมสำหรับนักลงทุนทุกคน ความเห็นที่แสดงในบทความนี้เป็นของผู้เขียนเท่านั้น และไม่ได้แทนนโยบายหรือตำแหน่งอย่างเป็นทางการของ Yellow ผู้ก่อตั้ง หรือผู้บริหาร ควรทำการวิจัยอย่างละเอียดด้วยตนเอง (D.Y.O.R.) และปรึกษาผู้เชี่ยวชาญทางการเงินที่ได้รับใบอนุญาตก่อนตัดสินใจลงทุนใดๆ เสมอ
ข่าวล่าสุด
แสดงข่าวทั้งหมด
ข่าวที่เกี่ยวข้อง
บทความวิจัยที่เกี่ยวข้อง
บทความการเรียนรู้ที่เกี่ยวข้อง
Claude Mythos แก้แฮ็ก AISI แบบ 32 ขั้นตอนสำเร็จ 6 จาก 10 ครั้ง | Yellow.com