Claude Mythos AI แซงคู่แข่งด้านการตรวจสอบโค้ด แต่เสียเปรียบตรงราคาสูงกว่าถึง 5 เท่า

profile-alexey-bondarev
Alexey Bondarev3 ชั่วโมงที่แล้ว
Claude Mythos AI แซงคู่แข่งด้านการตรวจสอบโค้ด แต่เสียเปรียบตรงราคาสูงกว่าถึง 5 เท่า

โมเดล AI Mythos ของ Anthropic นำหน้าระบบคู่แข่งในการค้นหาช่องโหว่ซอฟต์แวร์ แต่ผลทดสอบอิสระชุดใหม่เผยให้เห็นการตัดสินใจที่ยังอ่อนกว่าในบางมิติ และต้นทุนการใช้งานที่สูงชัน

Mythos Preview ทำผลงานโดดเด่นในงานตรวจสอบซอร์สโค้ด

บริษัทความปลอดภัยเชิงรุก XBOW ยืนยัน ตามคำกล่าวอ้างหลัก บริษัทระดมผู้เชี่ยวชาญ 10 คนมาประเมินโมเดลผ่านชุดทดสอบ เวิร์กโฟลว์ และการเชื่อมต่อระบบต่าง ๆ

XBOW ระบุว่า Mythos Preview “เป็นการก้าวกระโดดที่สำคัญเหนือกว่าโมเดลที่มีอยู่ทั้งหมดโดยไม่ขึ้นกับผู้ให้บริการ” ทีมทดสอบรันโมเดลกับแอปโอเพ่นซอร์สที่ตรึงเวอร์ชันไว้และมีช่องโหว่ที่รู้ล่วงหน้า

Mythos ลดอัตรา false negatives ได้ 42% เมื่อเทียบกับ Opus 4.6 และเมื่อให้สิทธิ์เข้าถึงซอร์สโค้ดด้วย ตัวเลขลดลงถึง 55% ตามที่ The Decoder รายงาน โมเดลทำผลงานได้ดีมากในงานทดสอบแบบรันสดควบคู่กับซอร์สโค้ด แต่ให้ผลไม่นิ่งนักเมื่อให้แค่ซอร์สโค้ดเพียงอย่างเดียว

อ่านเพิ่มเติม: XRP ETFs Hit Record $1.39B But Token Loses 4th Spot To BNB

คำถามเรื่องต้นทุนลดความได้เปรียบของ Anthropic

Anthropic ระบุว่า Mythos Preview จะมีราคาสูงกว่าโมเดล Opus ราว 5 เท่า ซึ่งเดิมก็ถือเป็นหนึ่งในตัวเลือกที่แพงที่สุดในตลาดอยู่แล้ว ส่วนต่างราคานี้ทำให้ XBOW ทดสอบว่าคู่แข่งที่ถูกกว่าจะสามารถทำผลงานสูสีได้หรือไม่หากให้เวลาในการรันมากขึ้น

คำตอบคือทำได้ ในการทดสอบด้วยงบโทเคนคงที่สำหรับการค้นหาช่องโหว่บนเว็บ Mythos เอาชนะ Opus 4.6 ได้ แต่กลับแพ้ GPT-5.5 ของ OpenAI ซึ่ง XBOW บันทึก อัตราการพลาดไว้ที่ 10% XBOW ชี้ว่าโมเดลนี้ “ไม่ได้ไม่มีประสิทธิภาพจนเกินไป” หากเป้าคือความแม่นยำ แต่ก็ไม่ใช่ตัวเลือกดีที่สุดเมื่อปรับเทียบด้วยต้นทุน

บริษัทจึงแนะนำให้ใช้โมเดลผสมผสานหลายตัวแทนการพึ่งพาเพียงตัวเดียว

วางผลงานของ Mythos AI ในบริบทกว้าง

Mythos แสดงให้เห็นการใช้วิจารณญาณแบบผสมผสาน ทำได้ดีกว่ารุ่นก่อนในการปฏิเสธผลลวงบวก (false positives) แต่บางครั้งก็ทิ้งผลที่เป็นจริงเมื่อหลักฐานไม่เข้าเกณฑ์ทางการที่ตั้งไว้ การรีเวิร์สเอนจิเนียร์และการวิเคราะห์โค้ดเนทีฟเป็นทักษะเด่นของโมเดล โดยสามารถจัดลำดับความสำคัญสิ่งที่ค้นพบจากระบบคู่แข่งได้

Anthropic เปิดตัว Mythos ครั้งแรกช่วงต้นเดือนเมษายน พร้อมจำกัดการเข้าถึงไว้ที่ราว 50 พาร์ทเนอร์ และวางกรอบว่าเป็นการยกระดับขีดความสามารถด้านไซเบอร์ของ AI อย่างมีนัยสำคัญ ต่อมา สถาบันความปลอดภัย AI ของสหราชอาณาจักรระบุว่า Mythos และ GPT-5.5 ต่างก็ “เหนือกว่าการคาดการณ์เร่งด่วน” ของหน่วยงานอย่างมาก ปัจจุบันหน่วยงานประเมินว่าความสามารถด้านไซเบอร์ของ AI จะเพิ่มขึ้นเท่าตัวทุก 4.7 เดือน ลดลงจากตัวเลขเดิมที่คาดไว้ราวทุก 8 เดือนเมื่อเดือนพฤศจิกายน 2025

อ่านถัดไป: Hyperliquid Rejects Wall Street's Manipulation Claims As HYPE Drops 14%

ข้อจำกัดความรับผิดชอบและคำเตือนความเสี่ยง: ข้อมูลที่ให้ไว้ในบทความนี้มีไว้เพื่อการศึกษาและการให้ข้อมูลเท่านั้น และอิงตามความเห็นของผู้เขียน ไม่ถือเป็นคำแนะนำทางการเงิน การลงทุน กฎหมาย หรือภาษี สินทรัพย์คริปโตมีความผันผวนสูงและมีความเสี่ยงสูง รวมถึงความเสี่ยงในการสูญเสียเงินลงทุนทั้งหมดหรือส่วนใหญ่ การซื้อขายหรือการถือครองสินทรัพย์คริปโตอาจไม่เหมาะสมสำหรับนักลงทุนทุกคน ความเห็นที่แสดงในบทความนี้เป็นของผู้เขียนเท่านั้น และไม่ได้แทนนโยบายหรือตำแหน่งอย่างเป็นทางการของ Yellow ผู้ก่อตั้ง หรือผู้บริหาร ควรทำการวิจัยอย่างละเอียดด้วยตนเอง (D.Y.O.R.) และปรึกษาผู้เชี่ยวชาญทางการเงินที่ได้รับใบอนุญาตก่อนตัดสินใจลงทุนใดๆ เสมอ
ข่าวล่าสุด
แสดงข่าวทั้งหมด
ข่าวที่เกี่ยวข้อง
บทความวิจัยที่เกี่ยวข้อง
บทความการเรียนรู้ที่เกี่ยวข้อง
Claude Mythos AI แซงคู่แข่งด้านการตรวจสอบโค้ด แต่เสียเปรียบตรงราคาสูงกว่าถึง 5 เท่า | Yellow.com