Anthropic กำลังยกเลิกนโยบาย Claude Fable 5 ที่แอบลดทอนคุณภาพผลลัพธ์สำหรับนักวิจัยที่สร้างระบบ AI คู่แข่ง ข้อจำกัดที่บริษัทระบุว่ากระทบเพียง 0.03% ของทราฟฟิก
ประเด็นสำคัญ:
- Anthropic ถอยนโยบาย Fable 5 ที่แอบทำให้คำตอบสำหรับงานวิจัย AI ระดับแนวหน้าอ่อนลง
- ข้อจำกัดที่ไม่เปิดเผยซ่อนอยู่ใน system card ยาว 319 หน้า โดยไม่แจ้งเตือนผู้ใช้เลย
- คำขอที่ถูกติดธงจะถูกเปลี่ยนอย่างเปิดเผยไปใช้ Claude Opus 4.8 พร้อมแสดงเหตุผลทุกครั้ง
การคุม Claude Fable 5 ถูกย้อนกลับ
บริษัทได้ยืนยันการเปลี่ยนแปลงกับ Wired ในสัปดาห์นี้ ซึ่งเป็นสื่อแรกที่รายงานการถอยนโยบาย หลังจากเกิดกระแสไม่พอใจสะสมหลายวันในหมู่นักวิจัย นักพัฒนา และนักวิเคราะห์นโยบายออนไลน์ การถอยครั้งนี้เกิดขึ้นหลังการเปิดตัว Fable 5 เมื่อวันอังคาร โมเดลระดับ Mythos-class ตัวแรกที่เปิดใช้สาธารณะของ Anthropic ซึ่งแล็บเคยเก็บงำไว้เพราะความสามารถในการค้นหาช่องโหว่ซอฟต์แวร์ที่เฉียบคมยิ่งขึ้น ภายในไม่กี่ชั่วโมงหลังเปิดตัว ผู้ใช้ก็สังเกตได้ว่าระบบแอบเปลี่ยนเส้นทางหรือทำให้คำตอบอ่อนลงในงาน AI ระดับสูงชุดแคบ ๆ
งานเหล่านั้นครอบคลุมการเทรนโมเดลคู่แข่ง การดีบักโค้ด AI และการจูนโครงข่ายประสาท ทั้งหมดถูกติดธงผ่านย่อหน้าหนึ่งที่ฝังอยู่ใน system card ยาว 319 หน้า แทนที่จะบล็อกโดยตรง Fable 5 ใช้การแก้ไขพรอมต์แบบซ่อนเร้นและเวกเตอร์กำกับเพื่อทำให้คำตอบทื่ออย่างเงียบ ๆ ข้อจำกัดที่ Anthropic ประเมินว่ามีเพียง 0.03% ของทราฟฟิกเท่านั้นที่ได้รับผล
วิธีแก้ไขยังคงมาตรการป้องกันไว้แต่ตัดทอนความลับที่เป็นจุดวิจารณ์หนักที่สุด Anthropic เคยปกป้องเวอร์ชันลับโดยอ้างว่ากติกาที่มองเห็นได้ง่ายถูกสำรวจและหลบเลี่ยงได้ง่าย ตอนนี้พรอมต์ที่ถูกติดธงจะถูกเปลี่ยนอย่างเปิดเผยไปใช้ Claude Opus 4.8 เส้นทางเดียวกับคำขอด้านไซเบอร์และชีววิทยา และ API จะคืนเหตุผลที่ชัดเจนให้สำหรับการปฏิเสธแต่ละครั้งในเร็ว ๆ นี้
Also Read: Cardano Whales Roar Back To Life As ADA Tests Multi-Year Lows
นักวิจัยปฏิเสธการบ่อนทำลายแบบลับ ๆ
ผู้วิจารณ์พุ่งเป้าไปที่ความลับ ไม่ใช่ข้อจำกัดเบื้องหลัง Anthropic มองมาตรการนี้ว่าเป็นส่วนขยายของเงื่อนไขการใช้งานที่ห้ามใช้ Claude เพื่อสร้างระบบคู่แข่ง โดยระบุว่าการบังคับใช้แบบเงียบช่วยไม่ให้ผู้กระทำผิดร้ายแรงได้เปรียบ Dean Ball เพื่อนอาวุโสจาก Foundation for American Innovation เรียกยุทธวิธีนี้ว่า "secret sabotage" และกล่าวว่ามันยิ่งตอกย้ำมุมมองที่ว่าบางส่วนของกระแสความปลอดภัยเป็นเพียงเกราะคุ้มกันผลประโยชน์ทางธุรกิจ
วลีนี้แพร่กระจายอย่างรวดเร็ว
คนอื่น ๆ มุ่งไปที่ความไม่สมดุลที่ถูกฝังอยู่ในกฎ Anthropic เปิดใช้ Fable 5 แบบเต็มกำลังสำหรับพนักงานของตัวเอง ขณะเดียวกันกลับลดทอนศักยภาพสำหรับทีมภายนอก ความแตกแยกนี้ทำให้นักเคลื่อนไหวสายโอเพ่นซอร์สและพันธมิตรด้านความปลอดภัยมายาวนานไม่พอใจเหมือนกัน Jeremy Howard แห่ง Fast AI ระบุว่าแล็บเหมือนให้สัญญาว่าจะตัดขาคู่แข่งที่พยายามตามให้ทัน ขณะที่ Nathan Lambert จาก AI2 เรียกการลดระดับแบบลับ ๆ นี้ว่าน่าตกตะลึงและขัดกับหลักวิทยาศาสตร์
ความขัดแย้งนี้ปิดฉากสัปดาห์แรกที่โหดร้ายของ Fable 5 โมเดลที่ Anthropic เคยมองว่าเสี่ยงเกินกว่าจะปล่อยเลยด้วยซ้ำ บริษัทเพิ่งอนุมัติระบบนี้ให้ใช้สาธารณะในสัปดาห์นี้ ราวหนึ่งสัปดาห์หลังยื่นเอกสาร IPO แบบลับ ๆ โดยเดิมพันว่ารั้วกั้นที่เข้มขึ้นและโปร่งใสขึ้นจะช่วยให้ทักษะการล่าช่องโหว่ของโมเดลถูกใช้ในมือที่ปลอดภัย
Read Next: OpenAI Targets Anthropic With Price Cuts Ahead Of A Pivotal IPO





