เช็กพอยต์ใหม่ของ Anthropic's Claude Mythos Preview กลายเป็นโมเดล AI แรกที่ผ่านการจำลองการโจมตีไซเบอร์ของรัฐบาลสหราชอาณาจักรทั้งสองแบบ ทำให้เกิดคำถามใหม่เกี่ยวกับการแฮ็กแบบอัตโนมัติ
AISI รายงานความก้าวหน้าของ Mythos
AI Security Institute ของสหราชอาณาจักร รายงาน เมื่อวันพุธว่าเช็กพอยต์ Mythos รุ่นใหม่สามารถทำภารกิจโจมตีเครือข่ายองค์กรแบบ 32 ขั้นตอน ในเรนจ์ชื่อ "The Last Ones" สำเร็จ 6 จาก 10 ครั้ง ขณะที่เวอร์ชันก่อนหน้าทำได้เพียง 3 จาก 10 ครั้ง
โมเดลที่อัปเดตแล้วยังสามารถผ่าน "Cooling Tower" ซึ่งเป็นเรนจ์ระบบควบคุมอุตสาหกรรมที่ไม่เคยมีโมเดลใดทำสำเร็จมาก่อน ด้วยอัตรา 3 จาก 10 ครั้ง
โมเดลคู่แข่งอย่าง OpenAI GPT-5.5 ถูกทดสอบกับแบบฝึกเดียวกัน โดย ทำสำเร็จ "The Last Ones" ได้ 3 จาก 10 ครั้ง แต่ไม่สามารถผ่าน "Cooling Tower" ได้
AISI รันเรนจ์ด้วยเพดานคอมพิวต์ 100 ล้านโทเคนต่อหนึ่งครั้งทดสอบ และหน่วยงานระบุว่าประสิทธิภาพยังคงสเกลขึ้นเรื่อยๆ ที่เพดานดังกล่าว แสดงให้เห็นว่างบคอมพิวต์ที่สูงกว่านี้น่าจะเพิ่มอัตราความสำเร็จได้อีก
Also Read: Southeast Asia Blockchain Week Brings Ripple, Avalanche, Solana Foundation, And K-Pop To Bangkok
เวลาการเพิ่มขีดความสามารถหดสั้นลงเรื่อยๆ
AISI ติดตามพัฒนาการด้านไซเบอร์ผ่านตัวชี้วัด time horizon โดยวัดว่าระบบสามารถทำภารกิจอัตโนมัติหนึ่งงานให้สำเร็จด้วยความน่าเชื่อถือ 80% ภายในเวลานานเท่าไร ในเดือนพฤศจิกายน 2025 หน่วยงานได้ ประเมิน ว่าเวลาการเพิ่มขีดความสามารถ (doubling time) อยู่ที่ 8 เดือน ภายในกุมภาพันธ์ 2026 ตัวเลขนี้หดเหลือ 4.7 เดือน และทั้ง Mythos กับ GPT-5.5 ก็ทำผลงานแซงเทรนด์ที่เร็วขึ้นนี้ไปแล้ว
หน่วยงานยอมรับว่ายังไม่แน่ชัดว่าผลลัพธ์ล่าสุดสะท้อนการเร่งตัวรอบใหม่ หรือเป็นเพียงการกระโดดครั้งเดียว
องค์กรวิจัยไม่แสวงกำไร METR ซึ่งติดตามความสามารถของ AI ในงานซอฟต์แวร์แทนที่จะเป็นไซเบอร์เรนจ์ ให้ค่าที่ใกล้เคียงกันราว 4.2 เดือน AISI ระบุว่าการที่ตัวเลขเริ่มบรรจบกันช่วยเสริมความเชื่อว่าเทรนด์นี้สะท้อนการเพิ่มขีดความสามารถจริง ไม่ใช่เพียงความลำเอียงของชุดประเมินผลชุดเดียว
สถาบันย้ำว่าเรนจ์ของตนไม่มีผู้ป้องกันเชิงรุกอยู่ในระบบ ดังนั้นผลลัพธ์จึงแสดงให้เห็นสิ่งที่โมเดลทำได้กับเครือข่ายที่ป้องกันอย่างอ่อนแอ มากกว่าจะเป็นระบบองค์กรที่แข็งแกร่งในโลกจริง
ทำไมการกระโดดด้านขีดความสามารถจึงสำคัญ
เช็กพอยต์ Mythos รุ่นใหม่นี้ไม่ได้มาพร้อมการปล่อยโมเดลเวอร์ชันใหญ่ใหม่ AISI ใช้เวอร์ชันเดียวกับที่ Anthropic นำไปใช้เมื่อเดือนที่แล้วกับ Project Glasswing โปรแกรมพันธมิตรด้านความปลอดภัย หลังจากได้รับบิลด์อัปเดตของโมเดลตัวเดิม
"การกระโดดด้านขีดความสามารถที่น่าสนใจไม่ได้จำเป็นต้องมาพร้อมการปล่อยโมเดลใหม่เสมอไป" สถาบันเขียนไว้ ซึ่งขัดกับสมมติฐานที่ว่าฝ่ายป้องกันสามารถวางแผนตามรอบการปล่อยโมเดลได้
Anthropic เปิดตัว Mythos Preview เมื่อวันที่ 7 เม.ย. โดยมองว่าโมเดลนี้เป็นจุดเปลี่ยนของอุตสาหกรรมความปลอดภัย หลังจากสามารถค้นหาช่องโหว่ zero-day ในระบบปฏิบัติการหลักๆ และเบราว์เซอร์หลากหลายตัวในการทดสอบภายใน บริษัทระบุว่า ได้ชะลอการปล่อยใช้งานวงกว้าง เพราะขีดความสามารถดังกล่าว และการประเมินก่อนหน้านี้ของ AISI ในเดือนเมษายนก็ชี้ว่า Mythos เป็นก้าวกระโดดที่ชัดเจนจากระบบแนวหน้ารุ่นก่อนๆ
Read Next: Gemini Space Station Hit By Multiple Securities Fraud Claims After IPO





