Google restringiu o acesso da Meta aos seus modelos de IA Gemini por volta de março, incapaz de fornecer a computação que a Meta queria, mesmo enquanto o backlog de sua nuvem crescia para cerca de US$ 460 bilhões.
Pontos-chave:
- O Google disse à Meta, por volta de março, que não conseguiria fornecer toda a capacidade de Gemini que ela queria comprar.
- A falta de capacidade atrasou vários projetos internos de IA da Meta e levou as equipes a racionar tokens de IA.
- O backlog de pedidos do Google Cloud quase dobrou para US$ 460 bilhões, sinal de que a demanda está superando a oferta.
Google raciona o fornecimento de Gemini
O Google informou à Meta, por volta de março, que não conseguiria atender totalmente à capacidade de Gemini que a empresa esperava comprar, relataram três pessoas familiarizadas com as conversas. Os limites prejudicaram vários projetos internos de IA da Meta, alguns ligados a código, ferramentas de publicidade e moderação de conteúdo no Facebook e no Instagram. Gestores disseram a engenheiros para usarem tokens de IA, as unidades que medem o uso de modelos, com mais parcimônia.
Outros clientes do Google também sentiram a pressão, embora a Meta tenha sofrido o impacto mais duro porque sua demanda ficou muito acima da maioria dos clientes. Tanto o Google quanto a Meta se recusaram a comentar os termos.
Em maio, o gigante das buscas tornou os limites oficiais, impondo restrições de uso em todos os seus apps Gemini. O acesso agora escala de acordo com a capacidade disponível, não com quanto o cliente está disposto a gastar. Essa única mudança reescreveu uma suposição básica sobre nuvem de IA.
Veja também: Bitcoin mantém US$ 62 mil enquanto HYPE e ADA impulsionam recuperação cripto no fim de semana
Pichai alerta sobre computação
Ao Google não falta demanda; ele está afogado nela, o que torna o limite tão contraintuitivo. A receita de nuvem ultrapassou US$ 20 bilhões em um único trimestre pela primeira vez, alta de cerca de 63% em relação ao ano anterior.
O diretor-presidente Sundar Pichai reconheceu a pressão na teleconferência de resultados, em que disse que a empresa está “limitada por computação no curto prazo”. Para qualquer empresa que constrói sobre plataformas externas de IA, a mensagem é dura. Um contrato corporativo assinado já não garante a computação em que a empresa baseia seus planos, independentemente do preço.
A Meta dependia do Gemini porque ele superava os modelos Llama próprios da empresa na remoção de golpes e posts nocivos. O limite acelerou sua guinada para um primeiro modelo interno, o Muse Spark, enquanto corta milhares de empregos e direciona até US$ 135 bilhões para IA neste ano.
O próprio aperto do Google é profundo.
A empresa concordou em pagar à SpaceX cerca de US$ 920 milhões por mês por aproximadamente 110 mil GPUs Nvidia, um paliativo que vários veículos confirmaram. Para cada dólar de demanda contratada, a empresa gasta apenas cerca de 40 centavos em nova capacidade, então o fosso continua se ampliando em vez de se fechar.
Leia a seguir: Queda no coding do Claude Fable 5 revela problema de roteador, não degradação do modelo





