OpenAI เปิดตัว GPT-5.5 แรงแซง Opus 4.7 ในงานด้านเอเจนต์และ 14 เกณฑ์วัดผล

OpenAI เปิดตัว GPT-5.5 เมื่อวันที่ 23 เม.ย. โดยวางตำแหน่งโมเดลโค้ดเนม "Spud" ว่าเป็นระบบที่เฉียบที่สุดของบริษัทสำหรับงานอัตโนมัติหลายขั้นตอน

การผลักดัน GPT-5.5 ด้าน Agentic Coding

การเปิดตัวนี้ lands ห่างจากที่ Anthropic pushed Claude Opus 4.7 สู่การให้บริการทั่วไปเพียงหนึ่งสัปดาห์ ตั้งฉากดวลตรง ๆ บนงานเอเจนต์ ตามรายงานของ TechCrunch และ Fortune

GPT-5.5 ถูกออกแบบมาให้วางแผน เรียกใช้เครื่องมือ ตรวจงานตัวเอง และวนปรับปรุงได้โดยไม่ต้องให้พรอมป์ตตลอดเวลา

ประธานบริษัท Greg Brockman เรียกมันว่าเป็น "คลาสใหม่ของปัญญา" ในการคุยกับสื่อ มองว่าเป็นอีกก้าวสู่ "คอมพิวติ้งที่เป็นเอเจนต์และเป็นธรรมชาติมากขึ้น"

โมเดลจะทยอยให้ใช้ใน ChatGPT Plus, Pro, Business และ Enterprise โดยมีรุ่น Pro ที่ทรงพลังขึ้นเปิดให้ใช้งานแล้ว ราคาผ่าน API เริ่มต้นที่ 5 ดอลลาร์ต่อโทเค็นขาเข้า 1 ล้านโทเค็น และ 30 ดอลลาร์ต่อโทเค็นขาออก 1 ล้านโทเค็น สำหรับหน้าต่างบริบทขนาด 1 ล้านโทเค็น

อ่านเพิ่มเติม: Ethereum Nears $2,450 Showdown As Bulls And Bears Split On Next Move

ช่องว่างคะแนน Benchmark เทียบ Opus 4.7

ตัวเลขของ OpenAI เอง ซึ่ง VentureBeat flagged ว่าเป็นระดับแนวหน้าใน 14 การประเมิน วาง GPT-5.5 ไว้ที่ 82.7% บน Terminal-Bench 2.0 ทิ้งห่าง Opus 4.7 ที่ 69.4%

บนชุดทดสอบ FrontierMath ระดับ 1 ถึง 3 โมเดลใหม่ทำได้ 51.7% เทียบกับ 43.8% ของเรือธงจาก Anthropic

คะแนนด้านการใช้คอมพิวเตอร์สูสีขึ้น โดย GPT-5.5 ได้ 78.7% บน OSWorld-Verified เทียบกับ Opus 4.7 ที่ 78.0% แม้ว่า GPT-5.5 Pro จะดึงคะแนนทิ้งห่างด้านการท่องเว็บที่ 90.1% ต่อ 79.3%

นักรีวิวยังยกให้ Opus 4.7 เด่นกว่าด้านงานเขียนเชิงวิจัย การทำตามคำสั่งที่เป๊ะกว่า และวิสัยทัศน์ความละเอียดสูงราว 3.75 เมกะพิกเซล

จังหวะการออกโมเดลยังคง tightening อย่างต่อเนื่อง GPT-5.5 มาหลัง GPT-5.4 เพียงหกสัปดาห์ ขณะที่ Anthropic ปล่อย Opus 4.6 ในเดือนกุมภาพันธ์ก่อนตามด้วย Opus 4.7 และ Google ก็ยังคงวาง Gemini 3.1 Pro ไว้ในกลุ่มเอ็นเตอร์ไพรซ์เดียวกัน

อ่านต่อ: TRON Connects $85B USDT Network To LI.FI In Cross-Chain DeFi Push