Anthropic กำลังกลับลำนโยบาย Claude Fable 5 policy ที่ลับ ๆ ลดทอนผลลัพธ์สำหรับนักวิจัยที่สร้างระบบ AI คู่แข่ง โดยบริษัทระบุว่าข้อจำกัดนี้กระทบทราฟฟิกเพียง 0.03%
ประเด็นสำคัญ:
- Anthropic ยกเลิกนโยบาย Fable 5 ที่แอบทำให้คำตอบสำหรับงานวิจัย AI ระดับแนวหน้าด้อยลง
- ขีดจำกัดที่ไม่เปิดเผยถูกซ่อนอยู่ในเอกสาร system card ยาว 319 หน้า โดยไม่แจ้งเตือนผู้ใช้เลย
- คำขอที่ถูกติดธงจะถูกเปลี่ยนไปใช้ Claude Opus 4.8 อย่างเปิดเผย พร้อมแสดงเหตุผลทุกครั้ง
ยกเลิกข้อจำกัด Claude Fable 5
บริษัทได้ ยืนยัน การเปลี่ยนแปลงกับ Wired ในสัปดาห์นี้ ซึ่งเป็นสื่อแรกที่รายงานการถอยหลัง หลังจากเกิดกระแสความไม่พอใจที่ทวีความรุนแรงขึ้นหลายวันในหมู่นักวิจัย นักพัฒนา และนักวิเคราะห์นโยบายออนไลน์ การถอยครั้งนี้เกิดตามหลังการเปิดตัว Fable 5 เมื่อวันอังคาร โมเดลระดับ Mythos-class model ตัวแรกของ Anthropic ที่เปิดสู่สาธารณะ ซึ่งห้องปฏิบัติการเคยกักไว้เพราะความสามารถเฉียบคมในการค้นหาช่องโหว่ซอฟต์แวร์ ภายในไม่กี่ชั่วโมงหลังเปิดตัว ผู้ใช้สังเกตว่ามันแอบเปลี่ยนเส้นทางหรือทำให้คำตอบอ่อนลงสำหรับงาน AI ขั้นสูงบางประเภท
งานเหล่านั้น ครอบคลุม การเทรนโมเดลคู่แข่ง การดีบักโค้ด AI และการปรับจูนโครงข่ายประสาท ซึ่งถูกติดธงไว้ในย่อหน้าหนึ่งที่ฝังอยู่ใน system card ยาว 319 หน้า แทนที่จะบล็อกตรง ๆ Fable 5 ใช้การแก้ prompt แบบซ่อนเร้นและเวกเตอร์นำทางเพื่อทำให้คำตอบจืดลงอย่างเงียบ ๆ ซึ่ง Anthropic ระบุว่ามีผลเพียง 0.03% ของทราฟฟิก
การแก้ไขครั้งนี้ยังคงมีมาตรการป้องกัน แต่ตัดทอนความลับที่ถูกวิจารณ์มากที่สุด Anthropic เคยปกป้องเวอร์ชันที่ซ่อนไว้ โดยอ้างว่ากฎที่มองเห็นได้ง่ายจะถูกสำรวจและหลบเลี่ยงได้ง่าย ตอนนี้ prompt ที่ถูกติดธงจะถูกเปลี่ยนไปใช้ Claude Opus 4.8 อย่างเปิดเผย เส้นทางเดียวกับคำขอด้านไซเบอร์และชีววิทยา และ API จะเพิ่มข้อความอธิบายเหตุผลของการปฏิเสธในไม่ช้า
Also Read: Cardano Whales Roar Back To Life As ADA Tests Multi-Year Lows
นักวิจัยไม่ยอมรับ “การบ่อนทำลายแบบลับ ๆ”
ผู้วิจารณ์มุ่งเป้าไปที่ “ความลับ” ไม่ใช่ที่ขีดจำกัดเบื้องหลัง Anthropic วางกรอบข้อจำกัดนี้ว่าเป็นส่วนขยายของข้อกำหนดการใช้งานที่ห้ามใช้ Claude เพื่อสร้างระบบคู่แข่ง โดยระบุว่าการบังคับใช้แบบเงียบช่วยไม่ให้ผู้กระทำผิดร้ายแรงได้เปรียบ Dean Ball เพื่อนอาวุโสประจำ Foundation for American Innovation เรียกยุทธวิธีนี้ว่า “secret sabotage” (การบ่อนทำลายแบบลับ ๆ) และบอกว่ามันยิ่งตอกย้ำมุมมองที่ว่าบางส่วนของการผลักดันด้านความปลอดภัยเป็นเพียงเกราะคุ้มกันผลประโยชน์ทางธุรกิจ
วลีนี้แพร่กระจายอย่างรวดเร็ว
คนอื่น ๆ เน้นไปที่ความไม่สมดุลที่ฝังอยู่ในกฎนี้ Anthropic เปิดใช้ Fable 5 แบบเต็มประสิทธิภาพสำหรับพนักงานของตนเอง แต่จำกัดทีมภายนอก ทำให้ผู้สนับสนุนโอเพ่นซอร์สและพันธมิตรด้านความปลอดภัยมายาวนานไม่พอใจ Jeremy Howard จาก Fast AI ระบุว่าห้องปฏิบัติการได้ให้คำมั่นว่าจะตัดกำลังคู่แข่งที่พยายามแข่งขัน ขณะที่ Nathan Lambert จาก AI2 called การลดระดับแบบลับ ๆ นี้ว่าน่าตกตะลึงและต่อต้านวิทยาศาสตร์
ความขัดแย้งนี้ปิดฉากสัปดาห์แรกอันระบมของ Fable 5 โมเดลที่ Anthropic เคยมองว่าเสี่ยงเกินกว่าจะปล่อยสู่สาธารณะ แต่บริษัทตัดสินใจเปิดใช้ระบบนี้ในวงกว้างสัปดาห์นี้ ราวหนึ่งสัปดาห์หลังยื่นเอกสาร IPO แบบปกปิด โดยเดิมพันว่ารั้วกันอันแน่นหนาและโปร่งใสยิ่งขึ้นจะช่วยให้รักษาความสามารถในการค้นหาช่องโหว่ให้อยู่ในมือที่ปลอดภัยได้
Read Next: OpenAI Targets Anthropic With Price Cuts Ahead Of A Pivotal IPO





