โมเดล AI Mythos ของ Anthropic นำหน้าระบบคู่แข่งในการค้นหาช่องโหว่ซอฟต์แวร์ แต่ผลทดสอบอิสระชุดใหม่เผยให้เห็นการตัดสินใจที่ยังอ่อนกว่าในบางมิติ และต้นทุนการใช้งานที่สูงชัน
Mythos Preview ทำผลงานโดดเด่นในงานตรวจสอบซอร์สโค้ด
บริษัทความปลอดภัยเชิงรุก XBOW ยืนยัน ตามคำกล่าวอ้างหลัก บริษัทระดมผู้เชี่ยวชาญ 10 คนมาประเมินโมเดลผ่านชุดทดสอบ เวิร์กโฟลว์ และการเชื่อมต่อระบบต่าง ๆ
XBOW ระบุว่า Mythos Preview “เป็นการก้าวกระโดดที่สำคัญเหนือกว่าโมเดลที่มีอยู่ทั้งหมดโดยไม่ขึ้นกับผู้ให้บริการ” ทีมทดสอบรันโมเดลกับแอปโอเพ่นซอร์สที่ตรึงเวอร์ชันไว้และมีช่องโหว่ที่รู้ล่วงหน้า
Mythos ลดอัตรา false negatives ได้ 42% เมื่อเทียบกับ Opus 4.6 และเมื่อให้สิทธิ์เข้าถึงซอร์สโค้ดด้วย ตัวเลขลดลงถึง 55% ตามที่ The Decoder รายงาน โมเดลทำผลงานได้ดีมากในงานทดสอบแบบรันสดควบคู่กับซอร์สโค้ด แต่ให้ผลไม่นิ่งนักเมื่อให้แค่ซอร์สโค้ดเพียงอย่างเดียว
อ่านเพิ่มเติม: XRP ETFs Hit Record $1.39B But Token Loses 4th Spot To BNB
คำถามเรื่องต้นทุนลดความได้เปรียบของ Anthropic
Anthropic ระบุว่า Mythos Preview จะมีราคาสูงกว่าโมเดล Opus ราว 5 เท่า ซึ่งเดิมก็ถือเป็นหนึ่งในตัวเลือกที่แพงที่สุดในตลาดอยู่แล้ว ส่วนต่างราคานี้ทำให้ XBOW ทดสอบว่าคู่แข่งที่ถูกกว่าจะสามารถทำผลงานสูสีได้หรือไม่หากให้เวลาในการรันมากขึ้น
คำตอบคือทำได้ ในการทดสอบด้วยงบโทเคนคงที่สำหรับการค้นหาช่องโหว่บนเว็บ Mythos เอาชนะ Opus 4.6 ได้ แต่กลับแพ้ GPT-5.5 ของ OpenAI ซึ่ง XBOW บันทึก อัตราการพลาดไว้ที่ 10% XBOW ชี้ว่าโมเดลนี้ “ไม่ได้ไม่มีประสิทธิภาพจนเกินไป” หากเป้าคือความแม่นยำ แต่ก็ไม่ใช่ตัวเลือกดีที่สุดเมื่อปรับเทียบด้วยต้นทุน
บริษัทจึงแนะนำให้ใช้โมเดลผสมผสานหลายตัวแทนการพึ่งพาเพียงตัวเดียว
วางผลงานของ Mythos AI ในบริบทกว้าง
Mythos แสดงให้เห็นการใช้วิจารณญาณแบบผสมผสาน ทำได้ดีกว่ารุ่นก่อนในการปฏิเสธผลลวงบวก (false positives) แต่บางครั้งก็ทิ้งผลที่เป็นจริงเมื่อหลักฐานไม่เข้าเกณฑ์ทางการที่ตั้งไว้ การรีเวิร์สเอนจิเนียร์และการวิเคราะห์โค้ดเนทีฟเป็นทักษะเด่นของโมเดล โดยสามารถจัดลำดับความสำคัญสิ่งที่ค้นพบจากระบบคู่แข่งได้
Anthropic เปิดตัว Mythos ครั้งแรกช่วงต้นเดือนเมษายน พร้อมจำกัดการเข้าถึงไว้ที่ราว 50 พาร์ทเนอร์ และวางกรอบว่าเป็นการยกระดับขีดความสามารถด้านไซเบอร์ของ AI อย่างมีนัยสำคัญ ต่อมา สถาบันความปลอดภัย AI ของสหราชอาณาจักรระบุว่า Mythos และ GPT-5.5 ต่างก็ “เหนือกว่าการคาดการณ์เร่งด่วน” ของหน่วยงานอย่างมาก ปัจจุบันหน่วยงานประเมินว่าความสามารถด้านไซเบอร์ของ AI จะเพิ่มขึ้นเท่าตัวทุก 4.7 เดือน ลดลงจากตัวเลขเดิมที่คาดไว้ราวทุก 8 เดือนเมื่อเดือนพฤศจิกายน 2025
อ่านถัดไป: Hyperliquid Rejects Wall Street's Manipulation Claims As HYPE Drops 14%





