Google'un Yeni Yapay Zekâ Modeli Nvidia GPU'larda Saniyede 1.000 Token'a Ulaşıyor

Google'un Yeni Yapay Zekâ Modeli Nvidia GPU'larda Saniyede 1.000 Token'a Ulaşıyor

Google DeepMind, 10 Haziran 2026'da, metni sıralı yerine paralel bloklar hâlinde üreten yeni metin üretim modeli DiffusionGemma'yı yayımladı.

Şirket, modelin Nvidia GPU donanımında saniyede 1.000 token'a kadar ulaştığını söylüyor.

Bir rapora göre, DeepMind'in kıyaslamaları DiffusionGemma'nın eşdeğer hesaplama gücünde önceki Gemma otoregresif modellerinden 4 kat daha hızlı çalıştığını gösteriyor. Ayrı bir kıyaslama raporu, Nvidia donanımı üzerinde yürütülen uzun bağlamlı çıkarım testlerinde 10 kat daha yüksek token işleme oranını doğruladı.

DiffusionGemma Nasıl Çalışıyor

Standart büyük dil modelleri aynı anda bir token üretir. DiffusionGemma ise difüzyon tabanlı bir mimari kullanarak tüm metin bloklarını eşzamanlı olarak üretir. Bu yaklaşım, özellikle uzun çıktılar için gecikmeyi ciddi biçimde azaltır. DeepMind, modelin üretim sırasında karmaşık markdown ve yapılandırılmış formatları kendi kendine düzelttiğini belirtiyor.

Bu yetenek, kod asistanları, dokümantasyon araçları ve yapılandırılmış veri boru hatları geliştiren yazılımcıları hedefliyor. Model, Nvidia RTX tüketici GPU'ları ve DGX kurumsal sistemlerinde yerel dağıtım için optimize edildi.

Also Read: SpaceX’s $75B IPO May Be In Trouble As Warren Pushes SEC Delay

Arka Plan

Google DeepMind, son bir yılda farklı kullanım senaryoları için açık ağırlıklı model ailesini genişleten çeşitli Gemma varyantları yayımladı. DiffusionGemma, DeepMind'in Gemma serisi içinde metin üretimine ilk kez difüzyon mimarisi uygulamasını temsil ediyor.

Diğer laboratuvarlardan önceki difüzyon tabanlı metin modelleri, araştırma ortamlarında hız avantajları gösterse de gerçek dünyadaki dağıtımları sınırlı kaldı. DeepMind'in bu yayımlaması, yaklaşımı mevcut geliştirici araçlarına sahip, yaygın kullanılan bir model ailesine taşıyor.

Bu zamanlama, Anthropic'in bu hafta başında muhakeme ve kodlama görevlerinde yeni kıyaslar belirleyen Claude Fable 5 sürümünü yayımlamasını izliyor. DeepMind'in donanım seviyesinde ham çıkarım hızına odaklanması, yüksek hacimli dağıtım için iş hacmini benchmark puanlarına göre önceleyen farklı bir rekabet eksenini hedefliyor.

Nvidia doğrudan fayda sağlıyor. DGX ve RTX optimizasyonu, Nvidia donanımını yerel düzeyde sınır modellerinin çıkarımı için varsayılan platform olarak pekiştiriyor.

İzlenmesi gerekenler arasında geliştirici benimseme hızı ve DiffusionGemma'nın işleme oranı değerlerinin Nvidia dışı donanım yapılandırmalarında da korunup korunamayacağı yer alıyor.

Read Next: SpaceX's $250B IPO Is Draining Crypto Liquidity, Traders Fear

Feragatname ve Risk Uyarısı: Bu makalede sağlanan bilgiler yalnızca eğitici ve bilgilendirici amaçlıdır ve yazarın görüşüne dayanmaktadır. Mali, yatırım, hukuki veya vergi tavsiyesi teşkil etmez. Kripto para varlıkları son derece değişkendir ve yatırımınızın tamamını veya önemli bir kısmını kaybetme riski dahil olmak üzere yüksek riske tabidir. Kripto varlık ticareti veya tutma tüm yatırımcılar için uygun olmayabilir. Bu makalede ifade edilen görüşler yalnızca yazara aittir ve Yellow, kurucuları veya yöneticilerinin resmi politikasını veya pozisyonunu temsil etmez. Her zaman kendi kapsamlı araştırmanızı yapın (D.Y.O.R.) ve herhangi bir yatırım kararı vermeden önce lisanslı bir finansal uzmanla görüşün.
Google'un Yeni Yapay Zekâ Modeli Nvidia GPU'larda Saniyede 1.000 Token'a Ulaşıyor | Yellow.com