ChatGPT Konuşurken Dinlemeyi Öğrenirken OpenAI Sessizce Bidi 1’i Test Ediyor

ChatGPT Konuşurken Dinlemeyi Öğrenirken OpenAI Sessizce Bidi 1’i Test Ediyor

OpenAI, ChatGPT’nin aynı anda dinlemesini ve konuşmasını sağlayan, duyurulmamış çift yönlü bir ses modeli olan Bidi 1’i test ediyor.

Öne Çıkan Noktalar:

  • Bidi 1, konuşmayı dondurmadan dinleyebiliyor, konuşabiliyor ve cümle ortasında gelen kesintileri kaldırabiliyor.
  • Kod referansları haziran ortasında ortaya çıktı ve OpenAI henüz resmi bir duyuru yapmadı.
  • Model, bazı uygulama kullanıcılarına ulaşmaya başladı; bu da nihai ismi değişse bile en erken bu hafta bir çıkışı işaret ediyor.

Bidi 1 ChatGPT Kodunda Ortaya Çıkıyor

Modele bağlı kod ve arayüz öğeleri, şirketin kamuya açık hiçbir şey söylemediği resmi tanıtımdan haftalar önce, yaklaşık 16 Haziran civarında ChatGPT uygulamasında ilk kez ortaya çıktı. Yeni seçenek, ayarlar altındaki model seçicisinde, kullanıcıların zaten bildiği standart ve gelişmiş ses modlarının yanında yer alıyor. Onu seçtiğinizde, ses balonu sarı renkte parlıyor.

İsim, her tur için kibarca beklemek yerine asistanın aynı anda konuşmasına, duymasına ve dinlemesine izin veren çift yönlü tasarım anlayışının kısaltması. Dahili kod, bunu sesin bir sonraki nesli ve zekâda büyük bir sıçrama olarak konumlandırıyor.

Erken test kullanıcıları, modelin şimdiden web ve mobildeki bazı kullanıcıların bir kısmına ulaşmaya başladığını söylüyor; bu, nihai ad hala değişebilse de en erken bu hafta bir sürüme işaret ediyor.

Ayrıca Oku: Anthropic Perp Satışı Öncesi Kripto Bahisleri İçin Bir Uyarı mı?

Bidi 1 Kesintilerle Ve Bellekle Başa Çıkıyor

Model, kullanıcı durakladığında veya yavaşladığında, konuşmacıyı bölmeden sakin bir “tamam” gibi küçük onaylar sunuyor. Bir kullanıcı araya girdiği anda sayımı tersine çevirerek anında görev de değiştirebiliyor. Raporlar, metin tarafında kullanıcıların hızlı veya daha dikkatli yanıtlar seçtiği mevcut seçenekleri yansıtan, Yüksek, Orta ve Anında olarak etiketlenmiş seçilebilir zekâ katmanlarından bahsediyor.

Bellek ise daha büyük bir değişim olabilir; çünkü Bidi 1, ChatGPT’nin mevcut ses katmanını uzun süredir zayıflatan nokta olan, önceki ses bağlamını düşürmek yerine uzun bir konuşmanın ipini elinde tutuyor. Bir diğer gözlem, model geliştirici arayüzüne ulaşıp harici uygulamaları güçlendirdiğinde yeni kullanım alanlarının önünü açabilecek gerçek zamanlı çeviriye işaret etti.

OpenAI’nin Ses Hamlesi Hız Kazanıyor

Bu yükseltme, OpenAI’nin güçlü metin modelleriyle, aylardır geri planda kalan eski ses katmanı arasındaki farkı kapatma girişimi olarak okunuyor. Bu katman, en baştan iki yönlü ses için inşa edilmemiş bir model olan GPT-4o’ya dayanıyordu. Şirket, çoğu insan için yapay zekâya asıl giriş yolunun yazmak değil, konuşmak olacağına oynuyor.

OpenAI, geçen yıl boyunca ChatGPT’nin ses özelliklerini istikrarlı bir şekilde iyileştirdi ve modelin, aceleye getirilmiş bir sürümden ziyade aylara yayılan çalışmanın ürünü olarak, 2026’nın başından beri geliştirilmekte olduğu bildiriliyor. Sızıntı, şirketin Codex kodlama aracı ve aracılık (agentic) özellikleri etrafında daha geniş bir ChatGPT yenilemesi haritasını çizerken aynı zamanda gündeme geliyor; ancak bunların hiçbiri henüz resmi değil.

Sırada Oku: Mane City Mobile 100+ Ülkede iOS Ve Android’e Geliyor

Feragatname ve Risk Uyarısı: Bu makalede sağlanan bilgiler yalnızca eğitici ve bilgilendirici amaçlıdır ve yazarın görüşüne dayanmaktadır. Mali, yatırım, hukuki veya vergi tavsiyesi teşkil etmez. Kripto para varlıkları son derece değişkendir ve yatırımınızın tamamını veya önemli bir kısmını kaybetme riski dahil olmak üzere yüksek riske tabidir. Kripto varlık ticareti veya tutma tüm yatırımcılar için uygun olmayabilir. Bu makalede ifade edilen görüşler yalnızca yazara aittir ve Yellow, kurucuları veya yöneticilerinin resmi politikasını veya pozisyonunu temsil etmez. Her zaman kendi kapsamlı araştırmanızı yapın (D.Y.O.R.) ve herhangi bir yatırım kararı vermeden önce lisanslı bir finansal uzmanla görüşün.