Anthropic membatalkan sebuah kebijakan Claude Fable 5 yang diam-diam menurunkan kualitas hasil bagi peneliti yang membangun sistem AI pesaing, sebuah pembatasan yang dikatakan perusahaan hanya menyentuh 0,03% trafik.
Poin Penting:
- Anthropic menarik kembali kebijakan Fable 5 yang secara diam-diam melemahkan jawaban untuk riset AI frontier.
- Batasan yang tidak diungkapkan itu tersembunyi di dalam kartu sistem setebal 319 halaman dan tanpa notifikasi kepada pengguna.
- Permintaan yang diberi tanda sekarang akan secara terbuka dialihkan ke Claude Opus 4.8, dengan alasan yang ditampilkan setiap kali.
Pembatasan Claude Fable 5 Dibatalkan
Perusahaan mengonfirmasi perubahan tersebut kepada Wired pekan ini, yang pertama kali melaporkan langkah mundur itu setelah berhari-hari kemarahan yang meningkat di kalangan peneliti, pengembang, dan analis kebijakan secara online. Langkah mundur ini menyusul peluncuran Fable 5 pada hari Selasa, model kelas Mythos pertama Anthropic yang tersedia untuk publik, sebuah sistem yang lama ditahan lab karena kecakapannya yang lebih tajam dalam menemukan kerentanan perangkat lunak. Dalam beberapa jam setelah rilis, pengguna melihat bahwa model ini diam-diam mengalihkan atau melemahkan jawabannya pada sebagian kecil pekerjaan AI tingkat lanjut.
Tugas-tugas tersebut mencakup pelatihan model pesaing, debugging kode AI, dan penyetelan jaringan saraf, semuanya diberi tanda melalui sebuah paragraf yang tersembunyi dalam kartu sistem setebal 319 halaman. Alih-alih memblokir secara langsung, Fable 5 mengandalkan penyuntingan prompt tersembunyi dan vektor pengarahan untuk secara halus menumpulkan jawabannya, sebuah pembatasan yang oleh Anthropic diklaim hanya mengenai 0,03% trafik.
Perbaikan ini mempertahankan pengaman tersebut tetapi menghapus kerahasiaan yang paling banyak dikritik. Anthropic sebelumnya membela versi tersembunyi dengan alasan bahwa aturan yang terlihat lebih mudah dianalisis dan diakali. Kini prompt yang diberi tanda akan secara terbuka dialihkan ke Claude Opus 4.8, jalur yang sama yang digunakan untuk permintaan terkait siber dan biologi, dan API dalam waktu dekat akan mengembalikan alasan yang jelas untuk setiap penolakan.
Juga Baca: Cardano Whales Roar Back To Life As ADA Tests Multi-Year Lows
Peneliti Menolak Sabotase Rahasia
Para pengkritik menyoroti kerahasiaannya, bukan batasannya. Anthropic membingkai pembatasan tersebut sebagai perpanjangan dari ketentuan yang melarang penggunaan Claude untuk membangun sistem pesaing, dengan mengatakan bahwa penegakan secara diam-diam mencegah pelanggar terburuk mendapatkan keuntungan. Dean Ball, senior fellow di Foundation for American Innovation, menyebut taktik ini sebagai "sabotase rahasia" dan mengatakan hal itu menguatkan pandangan bahwa sebagian dorongan keselamatan hanya melindungi kepentingan bisnis.
Frasa itu cepat menyebar.
Yang lain menyoroti asimetri yang tertanam dalam aturan tersebut. Anthropic mempertahankan Fable 5 pada kekuatan penuh untuk staf internalnya sementara membatasi tim luar, sebuah perbedaan yang membuat marah para pendukung open-source dan sekutu keselamatan lama. Jeremy Howard dari Fast AI mengatakan lab itu seolah bertekad melemahkan para pesaing yang mencoba, sementara Nathan Lambert dari AI2 menyebut penurunan kualitas terselubung itu mengerikan dan anti-sains.
Pertarungan ini menutup pekan pertama yang berat bagi Fable 5, model yang pernah dinilai Anthropic terlalu berisiko untuk dirilis sama sekali. Mereka mengizinkan sistem tersebut digunakan publik pekan ini, sekitar satu minggu setelah mengajukan dokumen IPO rahasia, dengan pertaruhan bahwa pagar pembatas yang lebih ketat dan lebih transparan dapat menjaga kemampuan pencarian kerentanannya tetap berada di tangan yang aman.
Baca Selanjutnya: OpenAI Targets Anthropic With Price Cuts Ahead Of A Pivotal IPO





