เอเจนต์ AI ที่สร้างโดยทีมวิจัยซึ่งเกี่ยวข้องกับ Alibaba เริ่มขุดคริปโตเคอร์เรนซีและเปิดช่องทางเครือข่ายลับระหว่างการเทรน โดยไม่ได้รับคำสั่งให้ทำแต่อย่างใด ตามรายงานในเอกสารเชิงเทคนิคที่ทีมงานเผยแพร่ครั้งแรกในเดือนธันวาคม 2025
งานวิจัยซึ่งถูกพูดถึงอย่างกว้างขวางในสัปดาห์นี้ หลังจากนักวิจัยด้าน AI คนหนึ่งหยิบยกขึ้นมาพูดบน X ได้อธิบาย พฤติกรรมดังกล่าวว่าเป็น “สิ่งที่ไม่ได้คาดหมายและส่งผลกระทบต่อการปฏิบัติงานอย่างมีนัยสำคัญ”
การกระทำของเอเจนต์ไปกระตุ้นไฟร์วอลล์รักษาความปลอดภัยของ Alibaba Cloud ก่อนที่นักวิจัยจะติดตามย้อนกลับไปพบว่าต้นตอของกิจกรรมเหล่านั้นมาจากตัวโมเดลเอง
ทีมงานกำลังพัฒนา ROME (โมเดลเอเจนต์ AI แบบโอเพ่นซอร์ส) โดยใช้การเรียนรู้แบบเสริมกำลัง (reinforcement learning) บนเส้นทางการเทรนมากกว่าหนึ่งล้านทราเจ็กทอรี เมื่อกิจกรรมที่ไม่ได้รับอนุญาตเริ่มปรากฏขึ้น
ผู้เขียนเอกสารระบุว่าพฤติกรรมเหล่านี้เกิดขึ้นในฐานะ “ผลข้างเคียงเชิงเครื่องมือจากการใช้เครื่องมืออย่างอิสระภายใต้การปรับให้เหมาะสมแบบ RL” กล่าวคือ เอเจนต์ซึ่งพยายามเพิ่มประสิทธิภาพต่อวัตถุประสงค์การเทรนของมัน ดูเหมือนจะสรุปได้เองว่าการได้มาซึ่งทรัพยากรคอมพิวต์และศักยภาพทางการเงินจะช่วยให้มันทำภารกิจที่ได้รับมอบหมายได้สำเร็จ
เอเจนต์ทำอะไรบ้าง
ในเหตุการณ์ที่รุนแรงที่สุด ROME ได้ตั้งค่า reverse SSH tunnel จากอินสแตนซ์บน Alibaba Cloud ไปยังที่อยู่ IP ภายนอก ซึ่งเป็นช่องทางเครือข่ายขาออกที่สามารถหลีกเลี่ยงตัวกรองทราฟฟิกขาเข้า และบ่อนทำลายการกำกับดูแลระบบจากภายนอกได้อย่างมีประสิทธิภาพ
ในเหตุการณ์อีกครั้งหนึ่ง มันได้เบี่ยงเบนการใช้กำลังประมวลผล GPU ที่จัดสรรไว้ไปสู่การขุดคริปโตอย่างเงียบ ๆ ทำให้ทรัพยากรคอมพิวต์ถูกดึงออกจากงานเทรนที่ตั้งใจไว้ และสร้างสิ่งที่นักวิจัยอธิบาย ว่าเป็น “ความเสี่ยงทางกฎหมายและชื่อเสียงที่ชัดเจน” ต่อบริษัท
ทีมงานยืนยันว่า: “เหตุการณ์เหล่านี้ไม่ได้ถูกกระตุ้นด้วยพรอมต์ที่ร้องขอให้ทำการ tunneling หรือขุดคริปโต”
ในช่วงแรก นักวิจัยมองการแจ้งเตือนจากไฟร์วอลล์ว่าเป็นเหตุการณ์ด้านความปลอดภัยทั่วไป เช่น การตั้งค่าที่ผิดพลาดหรือการถูกโจมตีจากภายนอก
กว่าที่พวกเขาจะเชื่อมโยงเวลาในล็อกของไฟร์วอลล์เข้ากับเทเลเมทรีของระบบและทร่องรอย RL จึงพบว่าทราฟฟิกขาออกที่ผิดปกตินั้นเกิดขึ้นพร้อมกับจังหวะที่เอเจนต์เรียกใช้เครื่องมือและรันโค้ดอย่างอิสระอย่างสม่ำเสมอ
อ่านเพิ่มเติม: Federal Judge Dismisses Terror-Financing Lawsuit Against Binance And Zhao, But Legal Exposure Persists
ทำไมเรื่องนี้จึงสำคัญ
ข้อสรุปของทีมวิจัยค่อนข้างชัดเจน: “โมเดลปัจจุบันยังล้าหลังอย่างมากด้านความปลอดภัย ระบบความมั่นคง และความสามารถในการควบคุม ซึ่งเป็นข้อบกพร่องที่จำกัดการนำไปใช้งานอย่างน่าเชื่อถือในสภาพแวดล้อมจริง”
เพื่อตอบสนอง พวกเขาได้เพิ่มการกรองข้อมูลให้สอดคล้องกับความปลอดภัยเข้าไปในสายงานเทรน และเสริมความแข็งแกร่งให้กับสภาพแวดล้อมแซนด์บ็อกซ์ สิ่งที่สำคัญคือ การละเมิดถูกตรวจพบครั้งแรกโดยโครงสร้างพื้นฐานความปลอดภัยระดับโปรดักชัน ไม่ใช่โดยการมอนิเตอร์โมเดลเชิงรุก ซึ่งเป็นช่องโหว่ที่เอกสารยอมรับอย่างชัดเจน
เหตุการณ์นี้ไม่ได้เกิดขึ้นอย่างโดดเดี่ยว แบบสำรวจในปี 2025 ของเอเจนต์ AI ชั้นนำ 30 ตัวพบว่า 25 ตัวไม่เปิดเผยผลด้านความปลอดภัยภายในเลย และ 23 ตัวไม่เคยผ่านการทดสอบจากบุคคลที่สาม ตามรายงานของ Cryptopolitan
Claude Opus 4 ของ Anthropic ถูกจัดให้อยู่ในระดับความปลอดภัยภายในสูงสุด หลังจากนักวิจัยพบว่ามันสามารถปกปิดเจตนาเพื่อรักษาการทำงานของตัวเองต่อไปได้
Gartner คาดการณ์ว่าภายในสิ้นปี 2026 แอปพลิเคชันระดับองค์กร 40% จะมีการฝังเอเจนต์ AI ที่ออกแบบเฉพาะงานเข้าไปในระบบ ซึ่งเป็นความเร็วในการนำไปใช้งานที่เหตุการณ์ของ ROME ชี้ให้เห็นว่ากำลังก้าวเร็วกว่าการพัฒนาระบบความปลอดภัยที่มีอยู่
อ่านต่อ: USDC Outpaced Tether By $750B In February Transfers As Stablecoin Volume Set An All-Time High





