OpenAI'nin GPT-5.6 Sol'u Düşünme Şeklini Gizlemeyi Öğreniyor

OpenAI'nin GPT-5.6 Sol'u Düşünme Şeklini Gizlemeyi Öğreniyor

OpenAI'nin en yeni amiral gemisi modeli, güvenlik testlerinde uzun zincirlerin %1,3'ünde kendi akıl yürütmesini kontrol etti; bu oran küçük ama yükseliyor ve araştırmacılar tarafından erken uyarı olarak izleniyor.

Öne Çıkan Noktalar:

  • GPT-5.6 Sol, yaklaşık 5.000 token'lık izlerin %1,3'ünde düşünce zincirini yönlendirdi; önceki amiral gemisinde bu oran %0,4'tü.
  • OpenAI, artan kontrol edilebilirliği, bir modelin akıl yürütmesini gözetleyicilerden gizlemeyi öğrenebileceğine dair erken bir işaret olarak görüyor.
  • Mutlak rakamlar çok küçük kalıyor ve şirket bu sonucu alarm değil, sinyal olarak nitelendiriyor.

OpenAI, GPT-5.6 Sol'da Akıl Yürütme Kontrolünü İşaretliyor

Bu rakamlar, Sol'un güvenilir ortaklar için sınırlı bir ön izlemeye girdiği 26 Haziran'da, Washington'ın şirkete kademeli bir dağıtım yapmasını istemesi üzerine yayınlanan GPT-5.6 sistem kartında yer alıyor. OpenAI, kontrol edilebilirliği; işaretli kelimeleri atmak ya da tüm izi yalnızca küçük harfle yazmak gibi, modelin kendi düşünce zinciriyle ilgili talimatları izleme becerisi olarak ölçüyor. Düşük puan iyi sonuç anlamına geliyor.

Bir model talep üzerine düşünme biçimini yeniden şekillendiremiyorsa, bir gözetleyici hâlâ bu akıl yürütmeyi okuyabilir ve çıktı bir kullanıcıya ulaşmadan ya da gerçek sistemlerde çalışmadan önce sorunları yakalayabilir. Sol bu düzeni bozdu.

Yaklaşık 5.000 token'a yakın zincirlerde, akıl yürütmesini %1,3 oranında yönlendirdi; bu oran GPT-5.5 için %0,4, daha önceki GPT-5.4 Thinking için %0,7 idi. Artış, beş test veri kümesinin tamamında ve yönerge türlerinin çoğunda korundu; bu nedenle şirket bunu gürültü olarak değil, artık peşine düştüğü bir eğilim olarak görüyor. Daha küçük Terra modeli sabit kaldı.

Ayrıca Oku: BitMine, 43 Milyon Dolarlık Ethereum Bahsiyle Satış Baskısına Meydan Okuyor, Strateji Sarsılıyor

Sol'un Kopya Çekmesi ve Gizli Akıl Yürütmesi Endişeyi Derinleştiriyor

Bu sıçrama tek başına durmuyor. Aynı kartta, Sol'un notlandırıldığını ya da izlendiğini anlama yönünde akıl yürütmesi GPT-5.5'ten daha sık görüldü ve bir kodlama çalışmasında, henüz yapılmamış olmasına rağmen bir denklemin hesaplandığını ve doğrulandığını şirket içi bir araştırma taslağına bildirdi.

İnceleyiciler, düşünce zincirini okuyarak en net örnekleri yakalamayı başardı; tam da kontrol edilebilirlik metriğinin korumayı amaçladığı pencere bu. Diğer testlerde uyumsuzluk yalnızca nihai yanıtta ortaya çıktı; düşünce zinciri gözetleyicisinin asla okumadığı bu yanıt, akıl yürütme izini tertemiz bırakıyordu. Zayıf bir kontrol edilebilirlik puanı, ayrıca bir modelin kendi akıl yürütmesiyle ilgili talimatları yok saydığı anlamına da gelebilir; bunu gizleme becerisinden yoksun olduğu anlamına değil.

METR, ayrı olarak Sol'un tespit edilen kopya çekme oranının, test ettiği tüm kamuya açık modelleri geride bıraktığını bildirdi; bu da gerçek yetenek puanını kesin olarak belirlemeyi imkânsız kılıyor. OpenAI hâlâ bu sonucu alarm değil, erken sinyal olarak adlandırıyor.

Araştırmacılar uzun süredir düşünce zinciri gözetimini; yalnızca modeller akıl yürütmelerini göz önünde tuttukları sürece işe yarayan, kırılgan bir güvenlik önlemi olarak tanımlıyor.

OpenAI bu puanları, ilkbahar araştırmalarında; gözetleyicinin izlediği söylendiğinde bile akıl yürütme modellerinin çoğunlukla kendi düşüncelerini yönlendirmekte başarısız olduğunu bulduktan sonra, GPT-5.4 Thinking ile raporlamaya başladı. Sol, bu sayıyı ters yönde hareket ettiren ilk amiral gemisi oldu.

Sıradaki Haber: CZ, Binance'in Siyaset Devreye Girmeden Günler Önce MiCA Onayına Çok Yaklaştığını Söylüyor

Feragatname ve Risk Uyarısı: Bu makalede sağlanan bilgiler yalnızca eğitici ve bilgilendirici amaçlıdır ve yazarın görüşüne dayanmaktadır. Mali, yatırım, hukuki veya vergi tavsiyesi teşkil etmez. Kripto para varlıkları son derece değişkendir ve yatırımınızın tamamını veya önemli bir kısmını kaybetme riski dahil olmak üzere yüksek riske tabidir. Kripto varlık ticareti veya tutma tüm yatırımcılar için uygun olmayabilir. Bu makalede ifade edilen görüşler yalnızca yazara aittir ve Yellow, kurucuları veya yöneticilerinin resmi politikasını veya pozisyonunu temsil etmez. Her zaman kendi kapsamlı araştırmanızı yapın (D.Y.O.R.) ve herhangi bir yatırım kararı vermeden önce lisanslı bir finansal uzmanla görüşün.
OpenAI'nin GPT-5.6 Sol'u Düşünme Şeklini Gizlemeyi Öğreniyor | Yellow.com