구글이 메타의 Gemini AI 모델 접근을 3월경 제한했다. 클라우드 수주잔고가 4,600억달러에 육박할 만큼 불어나는 가운데, 메타가 원했던 연산 자원을 공급하지 못했기 때문이다.
핵심 내용:
- 구글은 3월경 메타에, 메타가 구매하려던 Gemini 용량 전부를 공급할 수 없다고 통보했다.
- 이 부족분으로 메타의 여러 내부 AI 프로젝트가 지연됐고, 직원들은 AI 토큰을 아껴 쓰라는 지시를 받았다.
- 구글 클라우드의 주문 잔고는 거의 두 배인 4,600억달러로 늘었고, 이는 수요가 공급을 앞지르고 있음을 보여준다.
구글, Gemini 공급을 배분제로 전환
협상에 정통한 세 명의 관계자에 따르면, 구글은 3월경 메타에 회사가 구매를 희망하던 Gemini 용량을 완전히 제공할 수 없다고 알렸다. 이 제한으로 페이스북과 인스타그램 전반에 걸친 코딩, 광고 도구, 콘텐츠 조정과 관련된 메타의 여러 내부 AI 프로젝트가 차질을 빚었다. 관리자들은 모델 사용량을 측정하는 단위인 AI 토큰을 더 아껴 쓰라고 엔지니어들에게 지시했다.
다른 구글 고객들도 압박을 느꼈지만, 수요가 대부분 고객보다 훨씬 컸던 메타가 가장 큰 타격을 받았다. 구글과 메타 모두 구체적인 조건에 대해서는 언급을 거부했다.
5월, 구글은 이 상한을 공식화해 Gemini 앱 전반에 사용량 제한을 적용했다. 이제 접근 권한은 고객이 지불 의사가 있는 금액이 아니라, 사용 가능한 용량에 맞춰 조정된다. 이 단 한 번의 변화로 클라우드 AI에 대한 기본 전제가 뒤집혔다.
또 읽어보기: Bitcoin이 6만2천달러를 지키는 사이 HYPE와 ADA가 주말 암호화폐 반등을 견인
연산 자원에 대한 피차이의 경고
구글은 수요가 부족한 것이 아니라, 넘쳐나는 상황이다. 그래서 이번 상한 조치는 직관에 반하는 것처럼 보인다. 클라우드 매출은 분기 기준 처음으로 200억달러를 돌파해, 1년 전보다 약 63% 증가했다.
최고경영자 순다르 피차이는 실적 발표 전화에서 회사가 단기적으로는 “연산 제약” 상태에 있다고 언급했다. 외부 AI 플랫폼에 의존해 서비스를 구축하는 모든 기업에 이 메시지는 크게 다가온다. 이제는 가격을 얼마나 지불하든, 서명된 엔터프라이즈 계약이 기업이 계획한 연산 자원을 보장해 주지 못한다.
메타가 Gemini에 의존했던 이유는, 사기와 유해 게시물을 걸러내는 성능에서 자체 Llama 모델보다 앞섰기 때문이다. 상한선 도입은 메타가 수천 명을 감원하고 올해 최대 1,350억달러를 AI에 투입하는 과정에서, Muse Spark라는 첫 자체 모델로의 전환을 앞당겼다.
구글이 처한 제약도 상당히 깊다.
구글은 약 11만 개의 Nvidia GPU를 확보하기 위해 스페이스X에 매달 약 9억2천만달러를 지불하기로 합의했는데, 이는 임시방편일 뿐이라고 여러 매체가 전했다. 구글은 확약된 수요 1달러당 신규 용량에 약 40센트만 쓰고 있어, 격차는 줄어들기는커녕 더 벌어지고 있다.





