Anthropic Membatalkan Aturan Claude Fable 5 yang Melemahkan Hasil bagi Peneliti AI Pesaing

Anthropic membalikkan kebijakan Claude Fable 5 yang secara diam-diam menurunkan kualitas hasil bagi peneliti yang membangun sistem AI pesaing, sebuah pembatasan yang menurut perusahaan hanya menyentuh 0,03% lalu lintas.

Poin-Poin Utama:

Anthropic mundur dari kebijakan Fable 5 yang secara senyap melemahkan jawaban untuk riset AI garis depan.

Batas yang tidak diungkap itu tersembunyi dalam kartu sistem setebal 319 halaman dan melewati notifikasi pengguna.

Permintaan yang diberi tanda sekarang akan secara terbuka dialihkan ke Claude Opus 4.8, dengan alasan yang ditampilkan setiap kali.

Pembatasan Claude Fable 5 Dibatalkan

Perusahaan mengonfirmasi perubahan tersebut kepada Wired pekan ini, yang pertama kali melaporkan langkah mundur itu setelah berhari-hari kemarahan yang meningkat di kalangan peneliti, pengembang, dan analis kebijakan daring. Langkah mundur itu menyusul peluncuran Fable 5 pada hari Selasa, model kelas Mythos pertama Anthropic yang tersedia untuk publik, sebuah sistem yang lama ditahan lab tersebut karena kemampuannya yang lebih tajam dalam menemukan kelemahan perangkat lunak. Dalam hitungan jam setelah rilis, pengguna melihat bahwa model ini secara senyap mengalihkan atau melemahkan jawabannya pada sebagian kecil pekerjaan AI tingkat lanjut.

Tugas-tugas itu mencakup pelatihan model pesaing, debug kode AI, dan penyetelan jaringan saraf, semuanya ditandai melalui sebuah paragraf yang tersembunyi dalam kartu sistem setebal 319 halaman. Alih-alih memblokir secara langsung, Fable 5 mengandalkan pengeditan prompt tersembunyi dan vektor pengarahan untuk secara diam-diam menumpulkan jawabannya, sebuah pembatasan yang oleh Anthropic diklaim hanya mengenai 0,03% lalu lintas.

Perbaikan ini mempertahankan pengaman tersebut tetapi menghapus kerahasiaan yang paling memicu kritik. Anthropic sebelumnya membela versi tersembunyi itu dengan alasan bahwa aturan yang terlihat lebih mudah diuji dan diakali. Kini prompt yang diberi tanda akan secara terbuka dialihkan ke Claude Opus 4.8, jalur yang sama yang digunakan untuk permintaan siber dan biologi, dan API dalam waktu dekat akan mengembalikan alasan yang jelas untuk setiap penolakan.

Juga Baca: Cardano Whales Roar Back To Life As ADA Tests Multi-Year Lows

Peneliti Menolak Sabotase Rahasia

Para pengkritik menyoroti kerahasiaan itu sendiri, bukan batasan di baliknya. Anthropic membingkai pembatasan ini sebagai perpanjangan dari syarat yang melarang penggunaan Claude untuk membangun sistem pesaing, dengan mengatakan bahwa penegakan secara senyap membuat pelanggar terburuk sulit mendapat keuntungan. Dean Ball, peneliti senior di Foundation for American Innovation, menyebut taktik ini sebagai "sabotase rahasia" dan mengatakan bahwa hal itu menguatkan pandangan bahwa sebagian dorongan keselamatan hanya melindungi kepentingan bisnis.

Frasa itu menyebar dengan cepat.

Pihak lain menyoroti asimetri yang tertanam dalam aturan itu sendiri. Anthropic mempertahankan Fable 5 pada kekuatan penuh bagi staf internalnya sambil menahan tim eksternal, sebuah perbedaan yang membuat marah para pendukung open-source dan sekutu keselamatan lama. Jeremy Howard dari Fast AI mengatakan lab tersebut telah bertekad melemahkan pesaing yang mencoba, sementara Nathan Lambert dari AI2 menyebut penurunan kualitas secara tertutup itu mengerikan dan anti-sains.

Pertarungan ini menutup minggu pertama yang berat bagi Fable 5, sebuah model yang dulu dinilai Anthropic terlalu berisiko untuk diluncurkan sama sekali. Mereka membuka sistem ini untuk penggunaan publik pekan ini, sekitar satu minggu setelah mengajukan dokumen IPO rahasia, dengan bertaruh bahwa pagar pembatas yang lebih ketat dan lebih transparan dapat menjaga keterampilan pencarian kerentanannya tetap berada di tangan yang aman.

Baca Berikutnya: OpenAI Targets Anthropic With Price Cuts Ahead Of A Pivotal IPO