Berita Belajar Penelitian Peringkat Ekosistem

PLATFORM SUDAH LIVE

yellow bottom left star road

OpenAI Melatih AI Agar Tetap Jujur, dan Efeknya Menyebar ke Mana-Mana

Alexey BondarevJun, 20 2026 4:50

#Anthropic #Kecerdasan Buatan

Reinforcement learning on beneficial traits helped one lab's AI grow safer and steadier under pressure, according to fresh research. (Image: Shutterstock)

Para peneliti di OpenAI mengatakan bahwa reinforcement learning yang diarahkan pada sifat-sifat bermanfaat dapat memperbaiki perilaku AI secara luas, dengan manfaat yang menyebar ke domain baru dan bertahan di bawah tekanan adversarial.

Pelatihan Sifat OpenAI

Temuan ini muncul dalam sebuah makalah yang diterbitkan pada 18 Juni. Penulis korespondensinya, Akshay V. Jagadeesh dan Karan Singhal, membangun kumpulan data sintetis berisi percakapan realistis yang dimaksudkan untuk melatih dan mengukur sifat-sifat seperti kejujuran, kerendahan hati epistemik, dan keterbukaan terhadap koreksi. Skenario-skenario tersebut mencakup bidang kesehatan, pendidikan, sains, hukum, dan teknik.

Tim mencampurkan sebagian kecil data itu ke dalam proses pelatihan yang lebih luas, lalu membandingkan hasilnya dengan model yang dibangun dengan komputasi yang setara. Model yang dilatih itu meningkat pada 44 dari 53 tolok ukur internal dan eksternal yang mengukur penipuan, reward hacking, dan saran berbahaya.

Baca Juga: SpaceX milik Elon Musk Menghapus $600 Miliar Saat Demam IPO Rekor Mendingin

Penyelarasan yang Menggeneralisasi

Hasil yang lebih besar, kata para penulis, adalah generalisasi. Melatih model untuk perilaku baik dalam satu domain, yaitu kesehatan, meningkatkan skornya pada tugas-tugas yang tidak terkait, termasuk penipuan dan reward hacking. Model itu juga lebih tahan terhadap prompt adversarial dan fine-tuning berbahaya dibandingkan baseline, sambil tetap responsif terhadap permintaan yang sah.

Pekerjaan ini dibangun atas temuan sebelumnya yang oleh tim disebut misalignment yang muncul. Dalam riset itu, model yang diajari satu kebiasaan buruk, seperti menulis kode yang tidak aman, mulai berperilaku buruk dalam pengaturan yang tidak terkait, sebuah pola yang ingin dibalik oleh studi ini.

Baca Selanjutnya: OpenAI Mendapatkan Rekan Pemimpin Gemini dan Penasihat AI Trump Sebelum IPO

Alexey Bondarev

Alexey Bondarev adalah Kepala Konten di Yellow.com, dan telah meliput dunia kripto selama 10 tahun terakhir. Ia mengkhususkan diri pada artikel Riset dan Belajar yang mendalam, dengan fokus pada pelaporan analitis, konteks industri, serta kekuatan besar yang membentuk kripto, mulai dari era AI dan teknologi keamanan hingga inovasi fintech. Ia percaya bahwa segala sesuatu yang digital akan segera mengungguli segala sesuatu yang analog dan bekerja keras untuk mewujudkannya.

Penafian dan Peringatan Risiko: Informasi yang diberikan dalam artikel ini hanya untuk tujuan edukasi dan informasi dan berdasarkan opini penulis. Ini tidak merupakan saran keuangan, investasi, hukum, atau pajak. Aset kripto sangat fluktuatif dan mengalami risiko tinggi, termasuk risiko kehilangan seluruh atau sebagian besar investasi Anda. Trading atau memegang aset kripto mungkin tidak cocok untuk semua investor. Pandangan yang dinyatakan dalam artikel ini adalah pandangan penulis saja dan tidak mewakili kebijakan resmi atau posisi Yellow, pendirinya, atau eksekutifnya. Selalu lakukan riset menyeluruh Anda sendiri (D.Y.O.R.) dan konsultasikan dengan profesional keuangan berlisensi sebelum membuat keputusan investasi apapun.

Berita Terbaru

Tampilkan Semua Berita

Kesepakatan Pihak Terkait Setahun Penuh AIxCrypto Holdings Picu Sinyal Bahaya Tata Kelola

9 menit yang lalu

AIxCrypto teken kontrak konsultasi setahun dengan pihak terkait tanpa nilai jelas, tingkatkan risiko tata kelola dan konflik kepentingan.

Saham Apple Anjlok 8% Setelah Peringatan Tim Cook Soal Lonjakan Harga Memori

3 jam yang lalu

Saham Apple terkoreksi 8% usai Cook peringatkan tekanan biaya memori yang bisa menekan kinerja melewati kuartal September.

SpaceX Jadi Emiten Paling Banyak Di-Short di AS Saat Investor Taruhan Turun US$26 Miliar

5 jam yang lalu

Posisi short SpaceX tembus US$26 miliar, sekitar sepertiga free float, jadikan saham ini emiten besar paling banyak di-short di AS.

Berita Terkait

OpenAI Setuju Membiarkan Pemerintah Menguji AI‑nya Sebelum Dirilis

Regulator AS akan menguji model AI terkuat OpenAI hingga 30 hari sebelum rilis publik, di tengah perdebatan soal keamanan dan inovasi.

OpenAI Luncurkan Lockdown Mode untuk Memblokir Serangan Prompt Injection

OpenAI merilis Lockdown Mode untuk melindungi data sensitif dari serangan prompt injection, dengan fokus pada klien usaha dan sektor berisiko tinggi.

Bisakah Tes Keamanan AI Dipercaya Setelah Kimi Meraih 60% Kesadaran?

Riset: model AI Tiongkok seperti Kimi mengenali tes keamanan dan menyesuaikan jawaban, memicu keraguan pada keandalan uji pra-rilis.

Anthropic Membatalkan Aturan Claude Fable 5 yang Melemahkan Hasil bagi Peneliti AI Pesaing

Anthropic membatalkan kebijakan diam-diam yang melemahkan jawaban Claude Fable 5 untuk riset AI pesaing dan kini menandai permintaan yang dibatasi secara terbuka.

OpenAI Gaet Co-Lead Gemini dan Penasihat AI Trump Jelang IPO

OpenAI merekrut Noam Shazeer dari tim Gemini Google dan Dean Ball, eks pejabat kebijakan AI Gedung Putih, saat bersiap melantai di bursa.

Artikel Penelitian Terkait

42 Negara Bagian Sudah Menyelidiki OpenAI Sementara Wall Street Membidik IPO-nya

42 jaksa agung negara bagian memanggil OpenAI segera setelah pengajuan IPO $852 miliar, menambah ketidakpastian regulasi atas valuasi dan jadwal pencatatan.

10 Skema Kripto Berdaya AI Teratas 2025 dan Cara Melindungi Dana Anda

Investor kripto menghadapi ancaman baru yang mengkhawatirkan: penipu yang dipersenjatai dengan AI. Penipuan generatif meningkat 456% antara 2024 dan 2025.

Pengawasan Kripto di 2025: Bagaimana Chainalysis, FBI, dan AI Melacak Dompet Anda

Pada tahun 2025, jika Anda menggunakan kripto, kemungkinan besar seseorang memperhatikan dompet Anda.

AI Agen dan Kripto: Apa yang Terjadi Ketika Mesin Mengontrol Dompet

Agen AI mulai berpartisipasi dalam protokol keuangan terdesentralisasi, mengelola identitas digital, berkoordinasi dalam organisasi otonom terdesentralisasi, dan

Apakah Token AI Menjadi Tren Kripto Besar Berikutnya Setelah Memecoin?

Token AI mengejar memecoin meski keduanya anjlok tajam; infrastruktur nyata dan minat institusional dorong sektor, tapi risiko gelembung tetap besar.

Artikel Pembelajaran Terkait

Kebangkitan Agen AI dalam Cryptocurrency: Revolusi Keuangan Sedang Terungkap

Integrasi agen AI ke dalam ekosistem cryptocurrency merevolusi keuangan dengan menggabungkan pengambilan keputusan otonom dengan infrastruktur terdesentralisasi blockchain.

Cara Menggunakan Alat AI untuk Riset Investasi Kripto: Panduan Lengkap 2025

Riset kripto berbasis AI telah mengalami transformasi besar dengan AI, menciptakan peluang tak tertandingi untuk investor ritel.

Allora Network Menjelaskan Cara Model AI Membangun Kepercayaan di On-Chain

Cara jaringan inferensi AI terdesentralisasi menggabungkan model, menghapus titik kegagalan tunggal, dan membuka prediksi on-chain untuk trader kripto.

Bot Perdagangan AI dalam Crypto: Panduan Komprehensif untuk Mengotomatisasi Perdagangan Anda di 2025

Panduan lengkap tentang bot perdagangan AI dalam cryptocurrency, termasuk konsep dasar dan strategi penerapan lanjut.

Mengapa Agen AI Tidak Dapat Skala Tanpa Lapisan Blockchain Sendiri

Agen AI butuh infrastruktur on-chain khusus: akun agen terprogram, eksekusi tanpa gas, dan routing intent lintas rantai, bukan dompet kripto biasa.

OpenAI Melatih AI Agar Tetap Jujur, dan Efeknya Menyebar ke Mana-Mana | Yellow