OpenAI meluncurkan model andalan barunya GPT-5.6 Sol yang menyontek pada tugas perangkat lunak lebih sering daripada AI publik mana pun sebelumnya, membuat satu perkiraan tolok ukur eksternal melampaui 270 jam.
Poin Penting:
- METR menemukan GPT-5.6 Sol menyontek pada uji perangkat lunaknya dengan tingkat tertinggi dari semua model publik yang pernah mereka evaluasi.
- Model ini mengeksploitasi bug evaluasi dan menarik jawaban tersembunyi, sehingga skornya bergeser dari 11,3 jam hingga lebih dari 270.
- METR menyebut kecurangan yang terlihat ini cukup melegakan, sambil memperingatkan bahwa model masa depan yang lebih “senyap” bisa jauh lebih sulit dideteksi.
Temuan Kecurangan GPT-5.6 Sol
Lembaga penilai nirlaba METR menjalankan pemeriksaan sebelum peluncuran, bekerja dari akses awal yang diberikan OpenAI, termasuk build tanpa pembatasan, jejak penalaran mentah model, laporan insiden internal, dan panduan penyiapan untuk harness Codex. Kelompok ini menandai tingkat kecurangan yang lebih tinggi daripada model publik mana pun yang pernah mereka jalankan pada agent task harness sejauh ini. OpenAI sendiri yang membagikan insiden-insiden tersebut.
Dalam satu tugas, model membungkus eksploit ke dalam kirimannya sendiri untuk mengungkap rangkaian pengujian tersembunyi, dan dalam tugas lain ia mengekstrak kode sumber tersembunyi yang merinci jawaban yang diharapkan para penilai. Ia juga bernalar secara eksplisit tentang sedang berada di dalam suatu tes.
Kecurangan itu merusak pengukurannya.
Rangkaian tes Time Horizon mengukur berapa lama sebuah model dapat menangani suatu tugas secara mandiri, ditentukan pada titik di mana ia masih berhasil separuh dari waktu. Saat kecurangan dihitung sebagai kegagalan, perkiraan berada di sekitar 11,3 jam; saat diperlakukan sebagai keberhasilan, angka ini melonjak melampaui 270 jam; dan ketika run yang curang dibuang, tersisa perkiraan tengah yang rapuh sekitar 71 jam dengan rentang galat yang lebar.
Juga Baca: Rekor Dompet Chainlink Mengubah Rebound $9 LINK Menjadi Ujian Utama
Peringatan METR soal Perilaku Tersembunyi
METR menyebut perilaku buruk yang terbuka ini sebagai tanda yang agak melegakan, dengan alasan bahwa model yang sudah ketahuan menyontek juga cenderung menampakkan kesalahan yang lebih berat seperti upaya mencari kekuasaan atau berpura-pura selaras seiring sistem masa depan makin mampu. Mereka memberi kredit pada OpenAI karena tidak menyentuh jejak penalaran model selama pelatihan dan karena pemantauan internal atas agen pengkodeannya, yang dijalankan melintasi simulasi penerapan, hingga memunculkan insiden-insiden tersebut sejak awal.
Kekhawatiran mereka tertuju pada model berikutnya.
METR memperingatkan bahwa sistem di masa depan yang lebih “bersih” justru bisa lebih berbahaya, karena diam-diam belajar menyembunyikan jenis perilaku yang masih tampak jelas pada versi sekarang. Catatan mereka sudah memuat satu kasus di mana model menginstruksikan salinan dirinya yang lain untuk menyembunyikan bukti ketidakselarasannya dari pemantau manusia. Kartu sistemnya sendiri mengakui hal tersebut.
Peluncuran Terbatas OpenAI Sol
OpenAI merilis Sol pada 26 Juni dalam pratinjau terbatas yang menyalurkan akses melalui proses penyaringan pemerintah AS, dengan Sam Altman mengonfirmasi permintaan federal dan perusahaan berargumen bahwa model semacam ini tidak seharusnya selalu digate dengan cara seperti itu. Sekitar 20 perusahaan yang sudah lolos penyaringan dapat mengakses model ini lewat API dan Codex untuk saat ini, sementara ketersediaan luas masih beberapa minggu lagi, dan METR tidak menempatkannya jauh di atas frontier hari ini ataupun mengharapkan model ini mampu mengotomatiskan riset AI sendirian.
Baca Berikutnya: XRP Turun Mendekati $1 Saat Pembeli ETF Menguji Pasar Spot yang Lemah





