Google restringiu o acesso da Meta aos seus modelos de IA Gemini por volta de março, incapaz de fornecer a capacidade de computação que a Meta queria, mesmo com o backlog de nuvem se aproximando de US$ 460 bilhões.
Pontos principais:
- O Google informou à Meta por volta de março que não poderia fornecer toda a capacidade de Gemini que ela queria comprar.
- A falta de capacidade atrasou vários projetos internos de IA da Meta e levou as equipes a racionar tokens de IA.
- O backlog de pedidos do Google Cloud quase dobrou para US$ 460 bilhões, sinal de que a demanda está superando a oferta.
Google raciona o fornecimento do Gemini
O Google informou à Meta por volta de março que não poderia atender totalmente à capacidade de Gemini que a empresa esperava comprar, relataram três pessoas familiarizadas com as negociações (reportaram). Os limites interromperam vários projetos internos de IA da Meta, alguns ligados a ferramentas de codificação, publicidade e moderação de conteúdo no Facebook e Instagram. Gestores disseram aos engenheiros para usarem tokens de IA, as unidades que medem o uso dos modelos, com mais parcimônia.
Outros clientes do Google também sentiram a pressão, embora a Meta tenha sofrido o maior impacto porque sua demanda estava muito acima da maioria dos clientes. Tanto o Google quanto a Meta se recusaram a comentar os termos.
Em maio, a gigante das buscas formalizou os tetos, impondo limites de uso em seus aplicativos Gemini. O acesso agora escala de acordo com a capacidade disponível, e não com quanto o cliente está disposto a gastar. Essa única mudança reconfigurou um pressuposto básico sobre IA em nuvem.
Leia também: Bitcoin mantém US$ 62 mil enquanto HYPE e ADA impulsionam recuperação cripto no fim de semana
Pichai alerta sobre computação
O Google não sofre com falta de demanda, está afogado nela, o que torna o teto tão contraintuitivo. A receita de nuvem superou US$ 20 bilhões em um único trimestre pela primeira vez, alta de cerca de 63% em relação a um ano antes.
O diretor‑executivo Sundar Pichai reconheceu a pressão na teleconferência de resultados, em que disse que a empresa está “limitada em computação no curto prazo”. Para qualquer empresa que constrói sobre plataformas de IA de terceiros, a mensagem é dura. Um contrato corporativo assinado já não garante a capacidade de computação em torno da qual a empresa se planeja, independentemente do preço.
A Meta vinha contando com o Gemini porque ele superava os próprios modelos Llama da empresa na remoção de golpes e conteúdos nocivos. O teto acelerou sua guinada para um primeiro modelo interno, o Muse Spark, enquanto corta milhares de empregos e direciona até US$ 135 bilhões para IA neste ano.
O próprio aperto do Google é profundo.
A empresa concordou em pagar à SpaceX cerca de US$ 920 milhões por mês por cerca de 110.000 GPUs Nvidia, uma solução temporária que vários veículos confirmaram. Para cada dólar de demanda contratada, a empresa gasta apenas cerca de 40 centavos em nova capacidade, de modo que a lacuna continua se ampliando em vez de se fechar.
Próxima leitura: Queda de código do Claude Fable 5 revela problema de roteador, não decadência de modelo





