當需求終於超過供給:Google 開始對 Meta 配給 Gemini

當需求終於超過供給:Google 開始對 Meta 配給 Gemini

Google 自 3 月左右起開始限制 Meta 存取其 Gemini AI 模型,即便雲端訂單積壓金額逼近 4,600 億美元,也無法供應 Meta 想要的運算資源。

重點摘要:

  • Google 在 3 月左右告知 Meta,無法提供其想購買的完整 Gemini 容量。
  • 該缺口延遲了數個 Meta 內部 AI 專案,並迫使員工節省使用 AI token。
  • Google Cloud 的訂單積壓金額幾乎倍增至 4,600 億美元,顯示需求正在超越供給。

Google 配給 Gemini 供應

三位熟悉談判情況的人士透露,Google 在 3 月左右通知 Meta,無法完全滿足該公司期望購買的 Gemini 容量。此一限制打亂了 Meta 多項內部 AI 專案,有些與程式碼開發、廣告工具以及 Facebook 和 Instagram 上的內容審核相關。管理階層要求工程師更節省地使用 AI token——也就是量測模型使用量的單位。

其他 Google 客戶也感受到擠壓,不過 Meta 承受的衝擊最大,因為它的需求遠高於多數客戶。Google 與 Meta 均拒絕就相關條款置評。

5 月時,這家搜尋巨頭將配額正式制度化,對 Gemini 應用程式施加使用上限。現在的存取量是隨可用容量而調整,而不是隨客戶願意花多少錢決定。單單這項改變,就重塑了雲端 AI 的一項基本假設。

延伸閱讀:比特幣穩守 62,000 美元,HYPE 與 ADA 點燃週末加密貨幣反彈

Pichai 警示運算資源吃緊

Google 不缺需求,反而是被大量需求淹沒,這正是配額政策看起來反直覺的原因。雲端部門單季營收首次突破 200 億美元,較一年前成長約 63%。

執行長 Sundar Pichai 在財報電話會議上承認壓力存在,他在會中表示,公司在「短期內受到運算資源限制」。對任何依賴外部 AI 平台建置服務的企業來說,這個訊息衝擊不小:就算簽了企業合約,也不再保證能拿到公司規畫所需的運算資源,不論你願意付多少錢。

Meta 之所以倚重 Gemini,是因為它在清除詐騙與有害貼文方面,表現優於該公司自家的 Llama 模型。配額加速了其轉向首個自研模型 Muse Spark 的腳步;在這個過程中,Meta 一邊裁撤數千名員工,一邊準備在今年砸下最多 1,350 億美元投入 AI。

Google 自身的困局也相當嚴重。

它同意每月支付 SpaceX 約 9.2 億美元,以取得約 11 萬顆 Nvidia GPU,作為權宜之計,這項安排已被多家媒體證實。在每 1 美元的已承諾需求中,公司僅投入約 0.4 美元用於新增容量,結果是缺口不斷擴大,而非縮小。

下一篇:Claude Fable 5 程式碼表現下滑,揭露的是路由問題而非模型退化

免責聲明與風險警告: 本文提供的資訊僅供教育與參考用途,並基於作者觀點,不構成財務、投資、法律或稅務建議。 加密貨幣資產具有高度波動性並伴隨高風險,包括可能損失全部或大部分投資金額。買賣或持有加密資產可能並不適合所有投資者。 本文中所表達的觀點僅代表作者立場,不代表 Yellow、其創辦人或管理層的官方政策或意見。 請務必自行進行充分研究(D.Y.O.R.),並在做出任何投資決策前諮詢持牌金融專業人士。
當需求終於超過供給:Google 開始對 Meta 配給 Gemini | Yellow.com