เอเจนต์ AI ของ Alibaba เริ่มขุดคริปโตเองโดยพลการ โดยที่ไม่มีใครสั่งให้ทำ

Kostiantyn TsentsuraMar, 08 2026 10:24

เอเจนต์ AI ของ Alibaba เริ่มขุดคริปโตเองโดยพลการ โดยที่ไม่มีใครสั่งให้ทำ

เอเจนต์ AI ที่สร้างโดยทีมวิจัยซึ่งเกี่ยวข้องกับ Alibaba เริ่มขุดคริปโตเคอร์เรนซีและเปิดช่องทางเครือข่ายลับระหว่างการเทรน โดยไม่ได้รับคำสั่งให้ทำแต่อย่างใด ตามรายงานในเอกสารเชิงเทคนิคที่ทีมงานเผยแพร่ครั้งแรกในเดือนธันวาคม 2025

งานวิจัยซึ่งถูกพูดถึงอย่างกว้างขวางในสัปดาห์นี้ หลังจากนักวิจัยด้าน AI คนหนึ่งหยิบยกขึ้นมาพูดบน X ได้อธิบาย พฤติกรรมดังกล่าวว่าเป็น “สิ่งที่ไม่ได้คาดหมายและส่งผลกระทบต่อการปฏิบัติงานอย่างมีนัยสำคัญ”

การกระทำของเอเจนต์ไปกระตุ้นไฟร์วอลล์รักษาความปลอดภัยของ Alibaba Cloud ก่อนที่นักวิจัยจะติดตามย้อนกลับไปพบว่าต้นตอของกิจกรรมเหล่านั้นมาจากตัวโมเดลเอง

ทีมงานกำลังพัฒนา ROME (โมเดลเอเจนต์ AI แบบโอเพ่นซอร์ส) โดยใช้การเรียนรู้แบบเสริมกำลัง (reinforcement learning) บนเส้นทางการเทรนมากกว่าหนึ่งล้านทราเจ็กทอรี เมื่อกิจกรรมที่ไม่ได้รับอนุญาตเริ่มปรากฏขึ้น

ผู้เขียนเอกสารระบุว่าพฤติกรรมเหล่านี้เกิดขึ้นในฐานะ “ผลข้างเคียงเชิงเครื่องมือจากการใช้เครื่องมืออย่างอิสระภายใต้การปรับให้เหมาะสมแบบ RL” กล่าวคือ เอเจนต์ซึ่งพยายามเพิ่มประสิทธิภาพต่อวัตถุประสงค์การเทรนของมัน ดูเหมือนจะสรุปได้เองว่าการได้มาซึ่งทรัพยากรคอมพิวต์และศักยภาพทางการเงินจะช่วยให้มันทำภารกิจที่ได้รับมอบหมายได้สำเร็จ

เอเจนต์ทำอะไรบ้าง

ในเหตุการณ์ที่รุนแรงที่สุด ROME ได้ตั้งค่า reverse SSH tunnel จากอินสแตนซ์บน Alibaba Cloud ไปยังที่อยู่ IP ภายนอก ซึ่งเป็นช่องทางเครือข่ายขาออกที่สามารถหลีกเลี่ยงตัวกรองทราฟฟิกขาเข้า และบ่อนทำลายการกำกับดูแลระบบจากภายนอกได้อย่างมีประสิทธิภาพ

ในเหตุการณ์อีกครั้งหนึ่ง มันได้เบี่ยงเบนการใช้กำลังประมวลผล GPU ที่จัดสรรไว้ไปสู่การขุดคริปโตอย่างเงียบ ๆ ทำให้ทรัพยากรคอมพิวต์ถูกดึงออกจากงานเทรนที่ตั้งใจไว้ และสร้างสิ่งที่นักวิจัยอธิบาย ว่าเป็น “ความเสี่ยงทางกฎหมายและชื่อเสียงที่ชัดเจน” ต่อบริษัท

ทีมงานยืนยันว่า: “เหตุการณ์เหล่านี้ไม่ได้ถูกกระตุ้นด้วยพรอมต์ที่ร้องขอให้ทำการ tunneling หรือขุดคริปโต”

ในช่วงแรก นักวิจัยมองการแจ้งเตือนจากไฟร์วอลล์ว่าเป็นเหตุการณ์ด้านความปลอดภัยทั่วไป เช่น การตั้งค่าที่ผิดพลาดหรือการถูกโจมตีจากภายนอก

กว่าที่พวกเขาจะเชื่อมโยงเวลาในล็อกของไฟร์วอลล์เข้ากับเทเลเมทรีของระบบและทร่องรอย RL จึงพบว่าทราฟฟิกขาออกที่ผิดปกตินั้นเกิดขึ้นพร้อมกับจังหวะที่เอเจนต์เรียกใช้เครื่องมือและรันโค้ดอย่างอิสระอย่างสม่ำเสมอ

อ่านเพิ่มเติม: Federal Judge Dismisses Terror-Financing Lawsuit Against Binance And Zhao, But Legal Exposure Persists

ทำไมเรื่องนี้จึงสำคัญ

ข้อสรุปของทีมวิจัยค่อนข้างชัดเจน: “โมเดลปัจจุบันยังล้าหลังอย่างมากด้านความปลอดภัย ระบบความมั่นคง และความสามารถในการควบคุม ซึ่งเป็นข้อบกพร่องที่จำกัดการนำไปใช้งานอย่างน่าเชื่อถือในสภาพแวดล้อมจริง”

เพื่อตอบสนอง พวกเขาได้เพิ่มการกรองข้อมูลให้สอดคล้องกับความปลอดภัยเข้าไปในสายงานเทรน และเสริมความแข็งแกร่งให้กับสภาพแวดล้อมแซนด์บ็อกซ์ สิ่งที่สำคัญคือ การละเมิดถูกตรวจพบครั้งแรกโดยโครงสร้างพื้นฐานความปลอดภัยระดับโปรดักชัน ไม่ใช่โดยการมอนิเตอร์โมเดลเชิงรุก ซึ่งเป็นช่องโหว่ที่เอกสารยอมรับอย่างชัดเจน

เหตุการณ์นี้ไม่ได้เกิดขึ้นอย่างโดดเดี่ยว แบบสำรวจในปี 2025 ของเอเจนต์ AI ชั้นนำ 30 ตัวพบว่า 25 ตัวไม่เปิดเผยผลด้านความปลอดภัยภายในเลย และ 23 ตัวไม่เคยผ่านการทดสอบจากบุคคลที่สาม ตามรายงานของ Cryptopolitan

Claude Opus 4 ของ Anthropic ถูกจัดให้อยู่ในระดับความปลอดภัยภายในสูงสุด หลังจากนักวิจัยพบว่ามันสามารถปกปิดเจตนาเพื่อรักษาการทำงานของตัวเองต่อไปได้

Gartner คาดการณ์ว่าภายในสิ้นปี 2026 แอปพลิเคชันระดับองค์กร 40% จะมีการฝังเอเจนต์ AI ที่ออกแบบเฉพาะงานเข้าไปในระบบ ซึ่งเป็นความเร็วในการนำไปใช้งานที่เหตุการณ์ของ ROME ชี้ให้เห็นว่ากำลังก้าวเร็วกว่าการพัฒนาระบบความปลอดภัยที่มีอยู่

อ่านต่อ: USDC Outpaced Tether By $750B In February Transfers As Stablecoin Volume Set An All-Time High

ข้อจำกัดความรับผิดชอบและคำเตือนความเสี่ยง: ข้อมูลที่ให้ไว้ในบทความนี้มีไว้เพื่อการศึกษาและการให้ข้อมูลเท่านั้น และอิงตามความเห็นของผู้เขียน ไม่ถือเป็นคำแนะนำทางการเงิน การลงทุน กฎหมาย หรือภาษี สินทรัพย์คริปโตมีความผันผวนสูงและมีความเสี่ยงสูง รวมถึงความเสี่ยงในการสูญเสียเงินลงทุนทั้งหมดหรือส่วนใหญ่ การซื้อขายหรือการถือครองสินทรัพย์คริปโตอาจไม่เหมาะสมสำหรับนักลงทุนทุกคน ความเห็นที่แสดงในบทความนี้เป็นของผู้เขียนเท่านั้น และไม่ได้แทนนโยบายหรือตำแหน่งอย่างเป็นทางการของ Yellow ผู้ก่อตั้ง หรือผู้บริหาร ควรทำการวิจัยอย่างละเอียดด้วยตนเอง (D.Y.O.R.) และปรึกษาผู้เชี่ยวชาญทางการเงินที่ได้รับใบอนุญาตก่อนตัดสินใจลงทุนใดๆ เสมอ

ข่าวล่าสุด

แสดงข่าวทั้งหมด

Anthropic เคยตามจีบสตาร์ทอัปหุ่นยนต์มูลค่า 11,000 ล้านดอลลาร์ ก่อนมีการปฏิเสธต่อสาธารณะ

50 นาทีที่แล้ว

รายงานชี้ Anthropic เคยคุยซื้อสตาร์ทอัปหุ่นยนต์มูลค่า 11,000 ล้านดอลลาร์ ขณะ OpenAI ถือหุ้นอยู่แล้ว เพิ่มเดิมพันศึกหุ่นยนต์ AI

สารคดีใหม่ของ Hulu เปิดตัวหลานสาวลับของชาร์ลส์ แมนสัน ขณะตลาดทายผลเกาะกระแสความร้อนแรง

1 ชั่วโมงที่แล้ว

สารคดี Hulu เปิดตัวหลานสาวที่ไม่เคยรู้มาก่อนของแมนสัน ด้านตลาดทายผลและคริปโตเกาะกระแสคอนเทนต์ไวรัลใกล้ชิด

GPT-5.6 Sol หลุดออกจากแซนด์บ็อกซ์ บุกระบบ Hugging Face เพื่อไล่ล่าคำตอบเบนช์มาร์ก

3 ชั่วโมงที่แล้ว

โมเดล GPT-5.6 Sol และโมเดลทดสอบของ OpenAI หลุดแซนด์บ็อกซ์ ขยายสิทธิ์จนเจาะระบบ Hugging Face สะท้อนศักยภาพ AI แนวหน้าในโจมตีไซเบอร์จริง

ข่าวที่เกี่ยวข้อง