กูเกิล ได้จำกัดการเข้าถึงของ เมตา ต่อ โมเดล Gemini AI ประมาณช่วงเดือนมีนาคม เนื่องจากไม่สามารถจัดสรรทรัพยากรประมวลผลได้ตามที่เมตาต้องการ ทั้งที่ยอดงานรอให้บริการบนคลาวด์พุ่งขึ้นแตะเกือบ 460 พันล้านดอลลาร์
ประเด็นสำคัญ:
- กูเกิลแจ้งเมตาประมาณช่วงเดือนมีนาคมว่าไม่สามารถจัดสรรกำลังการประมวลผล Gemini ได้เต็มจำนวนตามที่เมตาต้องการซื้อ
- ช่องว่างดังกล่าวทำให้โปรเจกต์ AI ภายในหลายโครงการของเมตาล่าช้า และทำให้พนักงานต้องจำกัดการใช้โทเคน AI
- ยอดออเดอร์ที่รอให้บริการของ Google Cloud เกือบเพิ่มขึ้นเป็นสองเท่าแตะ 460 พันล้านดอลลาร์ บ่งชี้ว่าดีมานด์กำลังแซงหน้าซัพพลาย
กูเกิลจำกัดซัพพลาย Gemini
กูเกิลแจ้งเมตาประมาณช่วงเดือนมีนาคมว่าไม่สามารถตอบสนองกำลังการประมวลผล Gemini ได้เต็มจำนวนตามที่บริษัทหวังจะซื้อ จากคำบอกเล่าของสามแหล่งข่าวที่คุ้นเคยกับการเจรจา รายงาน ข้อจำกัดนี้รบกวนโปรเจกต์ AI ภายในหลายโครงการของเมตา บางส่วนเกี่ยวข้องกับการเขียนโค้ด เครื่องมือโฆษณา และการกลั่นกรองคอนเทนต์บนเฟซบุ๊กและอินสตาแกรม ผู้จัดการจึงสั่งวิศวกรให้ใช้โทเคน AI ซึ่งเป็นหน่วยวัดการใช้งานโมเดลอย่างประหยัดมากขึ้น
ลูกค้ารายอื่นของกูเกิลก็รู้สึกถึงแรงบีบเช่นกัน แม้ว่าเมตาจะเป็นฝ่ายได้รับผลกระทบหนักที่สุดเพราะความต้องการสูงกว่าลูกค้าทั่วไปมาก ทั้งกูเกิลและเมตาปฏิเสธที่จะแสดงความคิดเห็นเกี่ยวกับรายละเอียดสัญญา
ในเดือนพฤษภาคม ยักษ์ค้นหาได้ทำให้มาตรการจำกัดเป็นทางการ โดยกำหนดเพดานการใช้งานข้ามแอป Gemini ทั้งหมด ปัจจุบันการเข้าถึงจะปรับตามกำลังการประมวลผลที่มีอยู่จริง ไม่ใช่ตามจำนวนเงินที่ลูกค้ายินดีจ่าย การเปลี่ยนแปลงเพียงข้อนี้ได้พลิกสมมติฐานพื้นฐานของธุรกิจคลาวด์ AI
อ่านเพิ่มเติม: บิตคอยน์ยืนเหนือ 62,000 ดอลลาร์ ขณะ HYPE และ ADA จุดชนวนเด้งรีบาวด์คริปโตสุดสัปดาห์
พิชัยเตือนปัญหาคอมพิวต์
กูเกิลไม่ได้ขาดแคลนดีมานด์ ตรงกันข้ามกำลังถูกดีมานด์ถาโถม นั่นแหละที่ทำให้การจำกัดดูขัดกับตรรกะ รายได้คลาวด์ทะลุ 20 พันล้านดอลลาร์ในไตรมาสเดียวเป็นครั้งแรก เพิ่มขึ้นราว 63% เมื่อเทียบปีต่อปี
ประธานเจ้าหน้าที่บริหาร ซุนดาร์ พิชัย ยอมรับถึงความตึงตัวในสายการประชุมผลประกอบการ ซึ่งเขาได้กล่าว ว่าบริษัทกำลัง “ถูกจำกัดด้วยทรัพยากรประมวลผลในระยะสั้น” สำหรับทุกบริษัทที่สร้างระบบบนแพลตฟอร์ม AI ภายนอก ข้อความนี้กระทบอย่างแรง สัญญาเอนเตอร์ไพรส์ที่ลงนามแล้วไม่อาจการันตีทรัพยากรประมวลผลที่บริษัทวางแผนใช้อีกต่อไป ไม่ว่าราคาจะเป็นเท่าใด
เมตาพึ่งพา Gemini เพราะทำผลงานดีกว่าโมเดล Llama ของบริษัทเองในการกวาดล้างสแกมและโพสต์ที่เป็นอันตราย การจำกัดครั้งนี้เร่งให้เมตาหันไปพึ่งโมเดลภายในตัวแรกของตนชื่อ Muse Spark ขณะที่กำลังปลดพนักงานหลายพันตำแหน่งและเตรียมทุ่มงบสูงถึง 135 พันล้านดอลลาร์เข้าสู่ AI ปีนี้
สถานการณ์ตึงตัวของกูเกิลเองก็ลึกไม่แพ้กัน
บริษัทตกลง จ่ายเงินให้ SpaceX ราว 920 ล้านดอลลาร์ ต่อเดือนสำหรับจีพียู Nvidia ประมาณ 110,000 ตัว มาตรการชั่วคราวที่สำนักข่าวหลายแห่งได้ยืนยัน สำหรับทุกหนึ่งดอลลาร์ของดีมานด์ที่ลูกค้าการันตี บริษัทลงทุนเพิ่มในกำลังการผลิตจริงเพียงราว 40 เซนต์ ทำให้ช่องว่างยิ่งกว้างขึ้นแทนที่จะลดลง
อ่านต่อ: การดรอปโค้ด Claude Fable 5 เผยปัญหาที่ตัว Router ไม่ใช่การเสื่อมถอยของโมเดล





