Anthropic กลับลำกฎ Claude Fable 5 ที่ทำให้ผลลัพธ์ของนักวิจัย AI คู่แข่งแย่ลง

Anthropic กลับลำกฎ Claude Fable 5 ที่ทำให้ผลลัพธ์ของนักวิจัย AI คู่แข่งแย่ลง

Anthropic กำลังกลับลำนโยบาย Claude Fable 5 policy ที่ลับ ๆ ลดทอนผลลัพธ์สำหรับนักวิจัยที่สร้างระบบ AI คู่แข่ง โดยบริษัทระบุว่าข้อจำกัดนี้กระทบทราฟฟิกเพียง 0.03%

ประเด็นสำคัญ:

  • Anthropic ยกเลิกนโยบาย Fable 5 ที่แอบทำให้คำตอบสำหรับงานวิจัย AI ระดับแนวหน้าด้อยลง
  • ขีดจำกัดที่ไม่เปิดเผยถูกซ่อนอยู่ในเอกสาร system card ยาว 319 หน้า โดยไม่แจ้งเตือนผู้ใช้เลย
  • คำขอที่ถูกติดธงจะถูกเปลี่ยนไปใช้ Claude Opus 4.8 อย่างเปิดเผย พร้อมแสดงเหตุผลทุกครั้ง

ยกเลิกข้อจำกัด Claude Fable 5

บริษัทได้ ยืนยัน การเปลี่ยนแปลงกับ Wired ในสัปดาห์นี้ ซึ่งเป็นสื่อแรกที่รายงานการถอยหลัง หลังจากเกิดกระแสความไม่พอใจที่ทวีความรุนแรงขึ้นหลายวันในหมู่นักวิจัย นักพัฒนา และนักวิเคราะห์นโยบายออนไลน์ การถอยครั้งนี้เกิดตามหลังการเปิดตัว Fable 5 เมื่อวันอังคาร โมเดลระดับ Mythos-class model ตัวแรกของ Anthropic ที่เปิดสู่สาธารณะ ซึ่งห้องปฏิบัติการเคยกักไว้เพราะความสามารถเฉียบคมในการค้นหาช่องโหว่ซอฟต์แวร์ ภายในไม่กี่ชั่วโมงหลังเปิดตัว ผู้ใช้สังเกตว่ามันแอบเปลี่ยนเส้นทางหรือทำให้คำตอบอ่อนลงสำหรับงาน AI ขั้นสูงบางประเภท

งานเหล่านั้น ครอบคลุม การเทรนโมเดลคู่แข่ง การดีบักโค้ด AI และการปรับจูนโครงข่ายประสาท ซึ่งถูกติดธงไว้ในย่อหน้าหนึ่งที่ฝังอยู่ใน system card ยาว 319 หน้า แทนที่จะบล็อกตรง ๆ Fable 5 ใช้การแก้ prompt แบบซ่อนเร้นและเวกเตอร์นำทางเพื่อทำให้คำตอบจืดลงอย่างเงียบ ๆ ซึ่ง Anthropic ระบุว่ามีผลเพียง 0.03% ของทราฟฟิก

การแก้ไขครั้งนี้ยังคงมีมาตรการป้องกัน แต่ตัดทอนความลับที่ถูกวิจารณ์มากที่สุด Anthropic เคยปกป้องเวอร์ชันที่ซ่อนไว้ โดยอ้างว่ากฎที่มองเห็นได้ง่ายจะถูกสำรวจและหลบเลี่ยงได้ง่าย ตอนนี้ prompt ที่ถูกติดธงจะถูกเปลี่ยนไปใช้ Claude Opus 4.8 อย่างเปิดเผย เส้นทางเดียวกับคำขอด้านไซเบอร์และชีววิทยา และ API จะเพิ่มข้อความอธิบายเหตุผลของการปฏิเสธในไม่ช้า

Also Read: Cardano Whales Roar Back To Life As ADA Tests Multi-Year Lows

นักวิจัยไม่ยอมรับ “การบ่อนทำลายแบบลับ ๆ”

ผู้วิจารณ์มุ่งเป้าไปที่ “ความลับ” ไม่ใช่ที่ขีดจำกัดเบื้องหลัง Anthropic วางกรอบข้อจำกัดนี้ว่าเป็นส่วนขยายของข้อกำหนดการใช้งานที่ห้ามใช้ Claude เพื่อสร้างระบบคู่แข่ง โดยระบุว่าการบังคับใช้แบบเงียบช่วยไม่ให้ผู้กระทำผิดร้ายแรงได้เปรียบ Dean Ball เพื่อนอาวุโสประจำ Foundation for American Innovation เรียกยุทธวิธีนี้ว่า “secret sabotage” (การบ่อนทำลายแบบลับ ๆ) และบอกว่ามันยิ่งตอกย้ำมุมมองที่ว่าบางส่วนของการผลักดันด้านความปลอดภัยเป็นเพียงเกราะคุ้มกันผลประโยชน์ทางธุรกิจ

วลีนี้แพร่กระจายอย่างรวดเร็ว

คนอื่น ๆ เน้นไปที่ความไม่สมดุลที่ฝังอยู่ในกฎนี้ Anthropic เปิดใช้ Fable 5 แบบเต็มประสิทธิภาพสำหรับพนักงานของตนเอง แต่จำกัดทีมภายนอก ทำให้ผู้สนับสนุนโอเพ่นซอร์สและพันธมิตรด้านความปลอดภัยมายาวนานไม่พอใจ Jeremy Howard จาก Fast AI ระบุว่าห้องปฏิบัติการได้ให้คำมั่นว่าจะตัดกำลังคู่แข่งที่พยายามแข่งขัน ขณะที่ Nathan Lambert จาก AI2 called การลดระดับแบบลับ ๆ นี้ว่าน่าตกตะลึงและต่อต้านวิทยาศาสตร์

ความขัดแย้งนี้ปิดฉากสัปดาห์แรกอันระบมของ Fable 5 โมเดลที่ Anthropic เคยมองว่าเสี่ยงเกินกว่าจะปล่อยสู่สาธารณะ แต่บริษัทตัดสินใจเปิดใช้ระบบนี้ในวงกว้างสัปดาห์นี้ ราวหนึ่งสัปดาห์หลังยื่นเอกสาร IPO แบบปกปิด โดยเดิมพันว่ารั้วกันอันแน่นหนาและโปร่งใสยิ่งขึ้นจะช่วยให้รักษาความสามารถในการค้นหาช่องโหว่ให้อยู่ในมือที่ปลอดภัยได้

Read Next: OpenAI Targets Anthropic With Price Cuts Ahead Of A Pivotal IPO

ข้อจำกัดความรับผิดชอบและคำเตือนความเสี่ยง: ข้อมูลที่ให้ไว้ในบทความนี้มีไว้เพื่อการศึกษาและการให้ข้อมูลเท่านั้น และอิงตามความเห็นของผู้เขียน ไม่ถือเป็นคำแนะนำทางการเงิน การลงทุน กฎหมาย หรือภาษี สินทรัพย์คริปโตมีความผันผวนสูงและมีความเสี่ยงสูง รวมถึงความเสี่ยงในการสูญเสียเงินลงทุนทั้งหมดหรือส่วนใหญ่ การซื้อขายหรือการถือครองสินทรัพย์คริปโตอาจไม่เหมาะสมสำหรับนักลงทุนทุกคน ความเห็นที่แสดงในบทความนี้เป็นของผู้เขียนเท่านั้น และไม่ได้แทนนโยบายหรือตำแหน่งอย่างเป็นทางการของ Yellow ผู้ก่อตั้ง หรือผู้บริหาร ควรทำการวิจัยอย่างละเอียดด้วยตนเอง (D.Y.O.R.) และปรึกษาผู้เชี่ยวชาญทางการเงินที่ได้รับใบอนุญาตก่อนตัดสินใจลงทุนใดๆ เสมอ
ข่าวล่าสุด
แสดงข่าวทั้งหมด
ข่าวที่เกี่ยวข้อง
บทความวิจัยที่เกี่ยวข้อง
บทความการเรียนรู้ที่เกี่ยวข้อง
Anthropic กลับลำกฎ Claude Fable 5 ที่ทำให้ผลลัพธ์ของนักวิจัย AI คู่แข่งแย่ลง | Yellow.com