Anthropic ระบุว่ามีแผนจะเปิดให้สาธารณะเข้าถึงโมเดล Mythos, its vulnerability-hunting AI แต่จะทำก็ต่อเมื่อได้สร้างกลไกความปลอดภัยที่ตอนนี้ยังไม่มีขึ้นมาก่อน
Key Points:
- Anthropic วางแผนจะปล่อยโมเดลระดับ Mythos ให้ใช้อย่างกว้างขวาง หลังจากขยายการเข้าถึงให้รัฐบาลสหรัฐฯ และประเทศพันธมิตรก่อน
- บริษัทยอมรับว่าไม่มีบริษัทใด รวมถึงตัวมันเองที่สร้างกลไกป้องกันที่แข็งแรงพอจะหยุดการใช้งานในทางที่ผิดได้
- Mythos ตรวจพบประเด็นด้านความปลอดภัยมากกว่า 23,000 รายการในโปรเจ็กต์โอเพ่นซอร์ส 1,000 โครงการ รวมถึงช่องโหว่ระดับรุนแรงสูงหรือวิกฤต 6,202 รายการ
การปล่อย Anthropic Mythos
Anthropic confirmed แผนดังกล่าวในอัปเดตของ Project Glasswing ซึ่งเป็นโปรแกรมความปลอดภัยแบบจำกัดการเข้าถึง และรายงานแยกต่างหากระบุว่าไทม์ไลน์ยังไม่แน่นอน
บริษัทระบุว่าจะทำงานร่วมกับรัฐบาลสหรัฐฯ และรัฐบาลพันธมิตรเพื่อขยายโปรแกรมก่อน จากนั้นจึงจะปล่อย “โมเดลระดับ Mythos” ให้ใช้ในวงกว้างในอนาคตอันใกล้
Anthropic พูดอย่างตรงไปตรงมาเกี่ยวกับความเสี่ยง โดย stated ว่าไม่มีบริษัทใด รวมถึงตัวมันเอง ที่สร้างกลไกป้องกันที่แข็งแรงพอ จะป้องกันการใช้งานโมเดลในทางที่ผิดและก่อให้เกิดอันตรายร้ายแรงได้
แม้เช่นนั้น บริษัทคาดว่าเครื่องมือคล้ายกันจะถูกเผยแพร่อย่างรวดเร็ว และคาดการณ์ว่าโมเดลระดับ Mythos จะถูกใช้อย่างแพร่หลายภายในหกถึง 12 เดือน
Mythos debuted ในเดือนเมษายน Anthropic ระบุว่าโมเดลสามารถสร้างโค้ดโจมตีที่ใช้งานได้จริงสำเร็จ 72.4 เปอร์เซ็นต์ในการทดสอบ เทียบกับโมเดล Claude รุ่นก่อนหน้าที่แทบทำไม่ได้เลย
Also Read: Cisco Research Shows Frontier AI Models Failing Under Multi-Turn Attacks
ผลการค้นหาช่องโหว่ของ Mythos
นับตั้งแต่เปิดตัว โมเดลได้สแกนโปรเจ็กต์โอเพ่นซอร์สมากกว่า 1,000 โปรเจ็กต์ และ surfaced 23,019 issues โดยในจำนวนนั้น 6,202 รายการถูกจัดระดับความรุนแรงเป็นสูงหรือวิกฤต
หนึ่งในผลการค้นหาที่โดดเด่นคือ Mythos พบช่องโหว่ในไลบรารีการเข้ารหัส wolfSSL ซึ่งถูกใช้งานบนอุปกรณ์จำนวนหลายพันล้านชิ้น ช่องโหว่นี้อาจเปิดโอกาสให้ผู้โจมตีปลอมแปลงใบรับรอง และสวมรอยเป็นธนาคารหรือผู้ให้บริการอีเมลได้ โดยตอนนี้ช่องโหว่ดังกล่าวได้รับการแก้ไขแล้ว
จำนวนรายงานที่ถาโถมเข้ามาทำให้ผู้ที่ต้องรับผิดชอบในการแก้ไขได้รับภาระหนัก ผู้ดูแลโปรเจ็กต์โอเพ่นซอร์สได้ขอให้ Anthropic ชะลอการเปิดเผยข้อมูล โดยระบุว่าปริมาณรายงานเกินกว่าศักยภาพการจัดการของพวกเขา
นักวิจัยมองเห็นความไม่สมดุลที่ลึกกว่านั้น Anthropic ให้เหตุผลว่า ขณะนี้การค้นหาบั๊กทำได้ง่ายกว่าการแก้ไขอย่างมาก และบริษัทได้ partnered กับโครงการ Alpha-Omega ของ Open Source Security Foundation เพื่อช่วยผู้ดูแลจัดลำดับความสำคัญและจัดการงานค้าง
ระบบการ์ดของ Claude Mythos คาดการณ์ว่าในระยะยาว AI จะเอนเอียงไปทางผู้ป้องกันมากกว่า แม้ Anthropic จะยอมรับว่าขณะนี้ฝ่ายผู้โจมตียังอาจได้เปรียบอยู่
เมื่อ Mythos was first revealed Anthropic ได้ให้สิทธิ์เข้าถึงกับองค์กรกว่า 50 แห่ง รวมถึง Apple, Microsoft และ Google พร้อมเครดิตการใช้งานราว 100 ล้านดอลลาร์ โดยยังไม่เปิดโมเดลให้สาธารณะใช้เนื่องจากศักยภาพของโมเดลในการทำให้ช่องโหว่ซอฟต์แวร์ถูกนำไปใช้เป็นอาวุธ
Read Next: Cardano Whales Seize 67.5% Of ADA Supply, A Six-Year High





