新聞學習研究排名生態系統

平台現已上線

yellow bottom left star road

Google 全新 AI 模型在 Nvidia GPU 上每秒可生成 1,000 個權杖

Murtuza MerchantJun, 10 2026 22:29

#Google #人工智慧 #輝達 #Claude #Claude Fable #Anthropic

Google 全新 AI 模型在 Nvidia GPU 上每秒可生成 1,000 個權杖

Google DeepMind 於 2026 年 6 月 10 日發布 DiffusionGemma，這是一款新的文字生成模型，採用平行區塊生成文字，而非傳統的逐字生成。

公司表示，該模型在 Nvidia GPU 硬體上每秒可達到最多 1,000 個權杖的生成速度。

根據報告，DeepMind 的基準測試顯示，在相同運算資源下，DiffusionGemma 的運行速度比先前的 Gemma 自迴歸模型快 4 倍。另一份基準測試報告則確認，在 Nvidia 硬體上進行的長上下文推論測試中，其權杖吞吐量提高了 10 倍。

DiffusionGemma 的運作方式

標準大型語言模型一次只生成一個權杖。DiffusionGemma 則使用擴散式架構，同時生成整個文字區塊。這種做法大幅降低長篇輸出的延遲。

DeepMind 表示，該模型在生成過程中能自動修正複雜的 markdown 與結構化格式。

這項能力主要鎖定協助開發者打造程式碼助理、文件工具與結構化資料管線。模型針對在 Nvidia RTX 消費級 GPU 與 DGX 企業級系統上的本地部署進行了優化。

Also Read: SpaceX’s $75B IPO May Be In Trouble As Warren Pushes SEC Delay

背景

過去一年中，Google DeepMind 已推出多個 Gemma 變體，持續擴展這個開放權重模型家族，以支援不同使用情境。DiffusionGemma 則是 DeepMind 首次在 Gemma 系列中，將擴散式架構應用到文字生成。

其他研究機構先前推出的擴散式文字模型，在研究環境中已展現速度優勢，但在真實世界部署上仍相對有限。DeepMind 這次的發表，將此方法帶入一個已被廣泛採用、並具備既有開發工具鏈的模型家族中。

此發布時間緊接在 Anthropic 本週稍早推出 Claude Fable 5 之後，後者在推理與程式設計任務上創下新基準。相較之下，DeepMind 著重於硬體層級的推論原始速度，鎖定的是另一種競爭面向：優先提升大量部署情境下的吞吐量，而非單純追求基準測試分數。

Nvidia 亦可直接受惠。對 DGX 與 RTX 的優化，進一步鞏固 Nvidia 硬體作為本地前沿模型推論的預設平台地位。

值得關注的是開發者採用速度，以及 DiffusionGemma 的吞吐表現能否在非 Nvidia 硬體配置上同樣維持。

Read Next: SpaceX's $250B IPO Is Draining Crypto Liquidity, Traders Fear

免責聲明與風險警告：本文提供的資訊僅供教育與參考用途，並基於作者觀點，不構成財務、投資、法律或稅務建議。加密貨幣資產具有高度波動性並伴隨高風險，包括可能損失全部或大部分投資金額。買賣或持有加密資產可能並不適合所有投資者。本文中所表達的觀點僅代表作者立場，不代表 Yellow、其創辦人或管理層的官方政策或意見。請務必自行進行充分研究（D.Y.O.R.），並在做出任何投資決策前諮詢持牌金融專業人士。

相關新聞

兩大 AI 勁敵，共攤算力帳單：Google 300 億美元押注 SpaceX 內幕

Google 將自 2026 年起每月支付 SpaceX 9.2 億美元，換取 11 萬顆 Nvidia GPU 等硬體，以支撐 Gemini 等 AI 需求，協議至 2029 年中。

Render Network 認為 AI 真正的瓶頸不是 GPU 缺乏，而是算力浪費

AI 業界的問題不是 GPU 不足，而是運算資源配置低效。未來 AI 將結合去中心化算力、小型模型與 3D 創作工具。

Gemini 3.5 Flash 以三分之一價格，分數僅落後 Claude Opus 4.7 兩點

Google 推出 Gemini 3.5 Flash，以三分之一成本逼近 Claude Opus 4.7 與 GPT-5.5 表現，成為新預設模型並加劇高價旗艦的市場壓力。

Google 在 I/O 2026 祭出 3 大行動式 AI 重磅炸彈，Spark 成全場焦點

Google 在 I/O 2026 宣布「行動式 Gemini 時代」，推出 24/7 個人 AI 代理 Spark、Gemini 3.5 Flash 及多模態世界模型 Gemini Omni。

Google 推出 Titans，首個能即時更新自身記憶的 AI 系統

Google 推出 Titans 搭配 MIRAS 理論，提高 AI 長期記憶與即時學習，於長文本任務大幅優於 GPT-4，開創 AI 新時代。

相關研究文章

AI 計算需求遠超供給，加密網路正介入補位

io.net 暴漲超過 50%，凸顯去中心化 GPU 計算的機構與開發者需求。全球 AI 計算市場預估 2030 年將逾 7,000 億美元，DePIN 有望憑成本優勢切入。

AI 代幣會成為繼迷因幣之後的下一波加密潮流嗎？

AI 代幣市值在 15 個月內迅速逼近迷因幣，背後有實體算力與機構 ETF 申請支撐；但代理人代幣重挫，泡沫風險升高。

AI 代幣復甦：Bittensor 117% 漲勢能否帶動整個板塊回歸？

Bittensor 帶動 AI 代幣強勁反彈，單日板塊飆升 42%，但在 2025 年重挫 75% 後，整體市值仍只是 2024 年高點的一半。

加密貨幣中的 AI 智能代理——深度解析

2025 年初，AI 智能代理於加密貨幣領域爆紅，市值衝破千億美元，引發投資熱潮與平台搶進，成為區塊鏈新趨勢。

AI 加密貨幣交易：2025 年 GPT 交易機器人完整指南

AI 交易機器人於加密貨幣市場快速成長，將 GPT 技術與平台整合，推動交易策略平民化並提升整體績效。

相關學習文章

去中心化 AI 能讓你的提示保持隱私嗎？

介紹隱私導向 AI 網路如何透過去中心化節點、密碼學與硬體安全實現「私有推論」，並說明 Venice Token 的網路設計與區塊鏈結算角色。

什麼是 Bittensor？TAO 如何把 AI 模型變成去中心化市場

介紹 Bittensor 如何讓 AI 模型在去中心化網路中競爭、賺取 TAO，並說明子網架構、驗證機制與代幣經濟。

AI 代理現在急需便宜算力，去中心化雲端正好補位

介紹 Akash 去中心化雲端：透過反向拍賣把全球閒置算力變成開放市集，以 AKT/USDC 結算，特別適合 AI 推論與 DeFi 節點等重成本、輕 SLA 的工作負載。

為什麼 AI 智能體若沒有自己的區塊鏈層，就無法真正擴展

AI 智能體無法用傳統錢包：沒有持久身份、無法保管助記詞，也無法在機器速度下處理 Gas。新一代鏈上基礎設施正為智能體打造可編程帳戶、免 Gas 執行與意圖路由，基礎設施層才是 AI＋加密敘事的真正瓶頸。

如何使用 AI 工具進行加密貨幣投資研究：2025 完整指南

AI 推動加密貨幣研究革新，專業交易者與散戶皆能掌握進階策略與風險控管，提升投資成效。

Google 全新 AI 模型在 Nvidia GPU 上每秒可生成 1,000 個權杖 | Yellow