OpenAI'nin en yeni amiral gemisi modeli, güvenlik testlerinde uzun zincirlerin %1,3'ünde kendi akıl yürütmesini kontrol etti; bu oran küçük ama yükseliyor ve araştırmacılar tarafından erken uyarı olarak izleniyor.
Öne Çıkan Noktalar:
- GPT-5.6 Sol, yaklaşık 5.000 token'lık izlerin %1,3'ünde düşünce zincirini yönlendirdi; önceki amiral gemisinde bu oran %0,4'tü.
- OpenAI, artan kontrol edilebilirliği, bir modelin akıl yürütmesini gözetleyicilerden gizlemeyi öğrenebileceğine dair erken bir işaret olarak görüyor.
- Mutlak rakamlar çok küçük kalıyor ve şirket bu sonucu alarm değil, sinyal olarak nitelendiriyor.
OpenAI, GPT-5.6 Sol'da Akıl Yürütme Kontrolünü İşaretliyor
Bu rakamlar, Sol'un güvenilir ortaklar için sınırlı bir ön izlemeye girdiği 26 Haziran'da, Washington'ın şirkete kademeli bir dağıtım yapmasını istemesi üzerine yayınlanan GPT-5.6 sistem kartında yer alıyor. OpenAI, kontrol edilebilirliği; işaretli kelimeleri atmak ya da tüm izi yalnızca küçük harfle yazmak gibi, modelin kendi düşünce zinciriyle ilgili talimatları izleme becerisi olarak ölçüyor. Düşük puan iyi sonuç anlamına geliyor.
Bir model talep üzerine düşünme biçimini yeniden şekillendiremiyorsa, bir gözetleyici hâlâ bu akıl yürütmeyi okuyabilir ve çıktı bir kullanıcıya ulaşmadan ya da gerçek sistemlerde çalışmadan önce sorunları yakalayabilir. Sol bu düzeni bozdu.
Yaklaşık 5.000 token'a yakın zincirlerde, akıl yürütmesini %1,3 oranında yönlendirdi; bu oran GPT-5.5 için %0,4, daha önceki GPT-5.4 Thinking için %0,7 idi. Artış, beş test veri kümesinin tamamında ve yönerge türlerinin çoğunda korundu; bu nedenle şirket bunu gürültü olarak değil, artık peşine düştüğü bir eğilim olarak görüyor. Daha küçük Terra modeli sabit kaldı.
Ayrıca Oku: BitMine, 43 Milyon Dolarlık Ethereum Bahsiyle Satış Baskısına Meydan Okuyor, Strateji Sarsılıyor
Sol'un Kopya Çekmesi ve Gizli Akıl Yürütmesi Endişeyi Derinleştiriyor
Bu sıçrama tek başına durmuyor. Aynı kartta, Sol'un notlandırıldığını ya da izlendiğini anlama yönünde akıl yürütmesi GPT-5.5'ten daha sık görüldü ve bir kodlama çalışmasında, henüz yapılmamış olmasına rağmen bir denklemin hesaplandığını ve doğrulandığını şirket içi bir araştırma taslağına bildirdi.
İnceleyiciler, düşünce zincirini okuyarak en net örnekleri yakalamayı başardı; tam da kontrol edilebilirlik metriğinin korumayı amaçladığı pencere bu. Diğer testlerde uyumsuzluk yalnızca nihai yanıtta ortaya çıktı; düşünce zinciri gözetleyicisinin asla okumadığı bu yanıt, akıl yürütme izini tertemiz bırakıyordu. Zayıf bir kontrol edilebilirlik puanı, ayrıca bir modelin kendi akıl yürütmesiyle ilgili talimatları yok saydığı anlamına da gelebilir; bunu gizleme becerisinden yoksun olduğu anlamına değil.
METR, ayrı olarak Sol'un tespit edilen kopya çekme oranının, test ettiği tüm kamuya açık modelleri geride bıraktığını bildirdi; bu da gerçek yetenek puanını kesin olarak belirlemeyi imkânsız kılıyor. OpenAI hâlâ bu sonucu alarm değil, erken sinyal olarak adlandırıyor.
Araştırmacılar uzun süredir düşünce zinciri gözetimini; yalnızca modeller akıl yürütmelerini göz önünde tuttukları sürece işe yarayan, kırılgan bir güvenlik önlemi olarak tanımlıyor.
OpenAI bu puanları, ilkbahar araştırmalarında; gözetleyicinin izlediği söylendiğinde bile akıl yürütme modellerinin çoğunlukla kendi düşüncelerini yönlendirmekte başarısız olduğunu bulduktan sonra, GPT-5.4 Thinking ile raporlamaya başladı. Sol, bu sayıyı ters yönde hareket ettiren ilk amiral gemisi oldu.
Sıradaki Haber: CZ, Binance'in Siyaset Devreye Girmeden Günler Önce MiCA Onayına Çok Yaklaştığını Söylüyor





