Google ปล่อย Gemini 3.5 Flash ที่งาน I/O ทำคะแนน 55 บนดัชนีความฉลาดของ Artificial Analysis เข้าประชิด คู่แข่งจาก Anthropic และ OpenAI
ราคา Gemini Flash
โมเดลถูก ปล่อยใช้งานจริง ทั่วทั้ง Gemini API, Google AI Studio, Antigravity, Vertex AI และโหมด AI ใน Search คิดราคา 1.50 ดอลลาร์ต่อโทเคนขาเข้า 1 ล้านโทเคน และ 9.00 ดอลลาร์ต่อโทเคนขาออก 1 ล้านโทเคน ราวหนึ่งในสามของค่าใช้บริการ GPT-5.5 ที่คิด 5.00 และ 30.00 ดอลลาร์ต่อโทเคนขาเข้าและขาออก 1 ล้านโทเคนตามลำดับ ขณะที่ Anthropic คิด 5 และ 25 ดอลลาร์ต่อโทเคนขาเข้าและขาออก 1 ล้านโทเคนสำหรับ Claude Opus 4.7 ทำให้ระดับราคาใหม่ของ Google อยู่ที่ราวหนึ่งในสามของอัตรานั้นเช่นกัน
ผู้ทดสอบอิสระ Artificial Analysis จัดอันดับ โมเดลที่คะแนนรวมด้านความฉลาด 55 สูงกว่า Gemini 3 Flash รุ่นเก่า 9 แต้ม
ส่งผลให้โมเดลใหม่ตามหลัง Claude Opus 4.7 เพียงสองแต้ม และตามหลัง GPT-5.5 อยู่ห้าแต้ม
รุ่นนี้ถูกตั้งให้เป็นโมเดลเริ่มต้นในแอป Gemini และในโหมด AI ทั่วโลก
อ่านเพิ่มเติม: Twenty One Capital Becomes Tether's Bitcoin Arm As SoftBank Walks Away
ระดับ Pro กำลังมา
Google ระบุว่ารุ่น Pro กำลังใช้งานภายในและจะ เปิดตัว เดือนหน้า หาก Flash ทำคะแนนได้ 55 อยู่แล้ว รุ่น Pro น่าจะดันระดับความสามารถเข้าใกล้กลุ่มโมเดลแนวหน้าอย่าง Claude Opus 4.7 และ GPT-5.5
หัวหน้าฝ่ายเทคโนโลยีของ DeepMind Koray Kavukcuoglu บอกกับสื่อว่าโมเดล Flash “เหนือกว่าโมเดลแนวหน้าล่าสุดของเรา 3.1 Pro เกือบทุกชุดทดสอบ” Google รายงาน คะแนน 76.2% บน Terminal-Bench 2.1, 83.6% บน MCP Atlas และ Elo 1,656 บน GDPval-AA ซึ่งทั้งหมดสูงกว่ารุ่นเรือธงเดือนกุมภาพันธ์
แรงกดดันจากคู่แข่ง
การเปิดตัวนี้เกิดขึ้นท่ามกลางกระแสผู้ใช้คัดค้านโมเดลเรือธงที่ตั้งราคาพรีเมียม Anthropic ปล่อย Claude Opus 4.7 เมื่อวันที่ 16 เม.ย. และภายใน 48 ชั่วโมง นักพัฒนาพบว่าอัตราการใช้โทเคนเพิ่มขึ้น 1.5 ถึง 3 เท่าเมื่อเทียบกับ Opus 4.6 พร้อมรายงานเอาต์พุตที่ผิดพลาดแต่ตอบอย่างมั่นใจ OpenAI ขึ้นราคาค่าใช้ API ของรุ่นเรือธงเป็นสองเท่าพร้อม การปล่อย GPT-5.5 จนได้รับเสียงวิจารณ์คล้ายกันจากลูกค้า API
เครื่องมือสำหรับนักพัฒนาของ Google สูญเสียส่วนแบ่งให้กับ Claude Code และ Codex ของ OpenAI อย่างต่อเนื่องในช่วงปลายปี 2025 และต้นปี 2026 โดย Gemini 3.1 Pro ได้รับเสียงตอบรับระดับกลาง ๆ จากชุมชนแม้คะแนนจากงานวิจัยจะดี ผู้ใช้รายงานพฤติกรรมที่ไม่สม่ำเสมอในเฟรมเวิร์กของบุคคลที่สาม พร้อมทั้งบอกว่าโทนการสนทนาดูเป็นเชิงวิชาการเกินไปในการทดสอบเชิงคุณภาพ
เดิมชื่อ Flash ใช้เพื่อบอกว่าเป็นโมเดลขนาดเล็ก ราคาถูก แต่เมื่อ 3.5 Flash ทำคะแนนแซงรุ่นเรือธง Pro เดิมในด้านการโค้ดและชุดทดสอบเอเจนต์ได้ ความแตกต่างนั้นดูเหมือนจะเริ่มเลือนหายไปจากไลน์ผลิตภัณฑ์ของ Google
อ่านถัดไป: Security Experts Pour Cold Water On Claude Mythos Hacking Apocalypse





