Google hat den Zugriff von Meta auf seine Gemini-KI-Modelle etwa im März eingeschränkt, da es nicht in der Lage war, die von Meta gewünschte Rechenleistung zu liefern, obwohl sich der Cloud-Auftragsbestand auf 460 Milliarden US-Dollar auftürmte.
Zentrale Punkte:
- Google teilte Meta etwa im März mit, dass es die gewünschte Gemini-Kapazität nicht vollständig liefern könne.
- Der Engpass verzögerte mehrere interne KI-Projekte bei Meta und zwang Mitarbeitende dazu, KI-Tokens zu rationieren.
- Der Auftragsbestand von Google Cloud verdoppelte sich nahezu auf 460 Milliarden US-Dollar – ein Zeichen dafür, dass die Nachfrage das Angebot übersteigt.
Google rationiert Gemini-Kapazität
Google informierte Meta etwa im März darüber, dass es die von dem Unternehmen gewünschte Gemini-Kapazität nicht vollständig bereitstellen könne, berichteten drei mit den Gesprächen vertraute Personen berichteten. Die Begrenzungen störten mehrere interne KI-Projekte bei Meta, einige davon im Zusammenhang mit Programmierung, Werbetools und Inhaltsmoderation auf Facebook und Instagram. Manager forderten Ingenieurinnen und Ingenieure auf, KI-Tokens – die Einheiten, mit denen die Modellauslastung gemessen wird – sparsamer zu verwenden.
Auch andere Google-Kunden spürten den Druck, doch Meta traf es am härtesten, da seine Nachfrage deutlich über der der meisten anderen Kunden lag. Sowohl Google als auch Meta lehnten es ab, sich zu den Konditionen zu äußern.
Im Mai machte der Suchriese die Obergrenzen offiziell und führte Nutzungsbeschränkungen für seine Gemini-Angebote ein. Der Zugriff skaliert nun mit der verfügbaren Kapazität, nicht mit der Summe, die ein Kunde bereit ist auszugeben. Diese eine Änderung stellte eine grundlegende Annahme über Cloud-KI auf den Kopf.
Auch lesen: Bitcoin hält 62.000 US-Dollar, während HYPE und ADA die Krypto-Erholung am Wochenende anheizen
Pichai warnt vor Rechenengpässen
Google leidet nicht an mangelnder Nachfrage, sondern geht darin unter – was die Deckelung so kontraintuitiv macht. Der Cloud-Umsatz überschritt erstmals in einem Quartal die Marke von 20 Milliarden US-Dollar, ein Plus von rund 63 % im Vergleich zum Vorjahr.
Vorstandschef Sundar Pichai räumte die Belastung im Earnings Call ein, wo er sagte, das Unternehmen sei „kurzfristig rechenkapazitätsbeschränkt“. Für jedes Unternehmen, das auf externe KI-Plattformen setzt, ist die Botschaft deutlich: Ein unterschriebener Enterprise-Vertrag garantiert nicht mehr die Rechenleistung, auf deren Basis eine Firma plant – unabhängig vom Preis.
Meta hatte auf Gemini gesetzt, weil es die eigenen Llama-Modelle des Unternehmens beim Aufspüren von Betrug und schädlichen Beiträgen übertraf. Die Deckelung beschleunigte den Schwenk hin zu einem ersten eigenen Modell, Muse Spark, während das Unternehmen Tausende Stellen abbaut und in diesem Jahr bis zu 135 Milliarden US-Dollar in KI lenkt.
Googles eigene Zwangslage ist tiefgreifend.
Das Unternehmen hat zugestimmt, SpaceX rund 920 Millionen US-Dollar im Monat für etwa 110.000 Nvidia-GPUs zu zahlen – ein Provisorium, das mehrere Medien bestätigten. Für jeden Dollar an zugesagter Nachfrage investiert das Unternehmen nur etwa 40 Cent in neue Kapazität, sodass die Lücke eher wächst als schrumpft.
Als Nächstes lesen: Claude Fable 5 Coding Drop zeigt Router-Problem statt Modellverfall





