OpenAI ได้พรีวิวตระกูล GPT-5.6 ที่มีสามโมเดล เมื่อวันศุกร์ โดยจับคู่การพัฒนาอย่างก้าวกระโดดด้านโค้ด ชีววิทยา และความปลอดภัยไซเบอร์ เข้ากับการเปิดให้ใช้งานอย่างจำกัดเฉพาะพาร์ตเนอร์กลุ่มเล็ก ๆ ในตอนนี้
ประเด็นสำคัญ:
- GPT-5.6 เปิดตัวในรูปแบบตระกูลสามระดับ โดยมี Sol เป็นเรือธง Terra เป็นตัวเลือกสมดุล และ Luna ถูกออกแบบมาเพื่อความเร็ว
- โหมด max และ ultra แบบใหม่ช่วยให้ Sol ใช้เหตุผลได้นานขึ้น และแบ่งงานยาก ๆ ออกเป็นซับเอเจนต์แบบขนาน
- OpenAI จัดให้ทั้งสามระดับมีความเสี่ยงสูงด้านไซเบอร์และชีววิทยา ทำให้การเปิดให้ใช้งานวงกว้างต้องรอไปก่อน
ตระกูล GPT-5.6 เน้นงานโค้ดและงานไซเบอร์
บริษัทได้เปิดตัว Sol ในฐานะโมเดลที่ทรงพลังที่สุดของตนจนถึงปัจจุบัน Terra เป็นระดับใช้งานทั่วไปที่สมดุลและตั้งราคาประมาณครึ่งหนึ่งของรุ่นก่อนหน้า และ Luna เป็นตัวเลือกที่เร็วที่สุดที่ราคา 1 ดอลลาร์ต่อโทเคนอินพุตหนึ่งล้านโทเคน ระบบการตั้งชื่อแบบใหม่ใช้ตัวเลขแทนรุ่นของโมเดล ขณะที่ชื่อแต่ละตัวแทนระดับความสามารถที่ทนทาน แต่ละระดับสามารถพัฒนาในตารางเวลาของตนเอง ทำให้นักพัฒนามองเห็นทางเลือกที่ชัดเจนขึ้นระหว่างความเร็ว ความลึก และราคา
GPT-5.6 ยังเปิดตัวสองวิธีใหม่ในการผลักดันให้ Sol ทำงานงานยาวหลายขั้นตอนได้หนักขึ้น การตั้งค่าแบบ max ทำให้โมเดลมีเวลา “คิด” มากขึ้น ส่วนโหมด ultra จะแบ่ง งานซับซ้อนออกไปยังซับเอเจนต์หลายตัวที่รันแบบขนาน ก่อนรวมผลลัพธ์เข้าด้วยกัน
OpenAI ยังวางแผนจะรัน Sol บนชิป Cerebras ด้วยความเร็วสูงสุด 750 โทเคนต่อวินาทีในเดือนกรกฎาคม
Sol ทำสถิติ คะแนนสูงใหม่บน Terminal-Bench 2.1 แบบทดสอบงานบรรทัดคำสั่งที่ต้องอาศัยการวางแผนและการประสานงานกับเครื่องมือ ในการวิเคราะห์จีโนมิกส์ Sol ทำคะแนนเหนือ GPT-5.5 เล็กน้อยขณะใช้โทเคนน้อยกว่า
ในแบบทดสอบช่องโหว่ตัวหนึ่ง Sol ทำได้สูสี กับ Mythos Preview ของ Anthropic โดยใช้โทเคนเอาต์พุตราวหนึ่งในสาม
อ่านเพิ่มเติม: สถิติกระเป๋าเงินของ Chainlink ทำให้การเด้งกลับสู่ 9 ดอลลาร์ของ LINK กลายเป็นบททดสอบหลัก
ระดับความเสี่ยงของ ChatGPT กำลังกำหนดการเข้าถึง AI ใหม่
OpenAI ได้จัดระดับ โมเดลทั้งสามว่าเป็นความเสี่ยงสูงทั้งด้านการใช้ในทางไซเบอร์และชีววิทยา ซึ่งถือเป็นครั้งแรกสำหรับระดับที่เล็กลงและราคาถูกลงของบริษัท บริษัทระบุว่าไม่มีโมเดลใดถึงระดับวิกฤตที่จะต้องใช้ข้อจำกัดสูงสุด และ Sol ทำผลงานได้ดีกว่าในการค้นหาและแก้ไขช่องโหว่มากกว่าการรันการโจมตีเต็มรูปแบบ
การจัดอันดับนั้นช่วยอธิบายว่าทำไมการเข้าถึงจึงยังคงแคบอยู่ในตอนนี้ มีเพียงประมาณ 20 องค์กรที่ผ่านการรับรองโดยรัฐบาลที่สามารถรันโมเดลเหล่านี้ได้ในช่วงพรีวิว โดยสัญญาว่าจะขยายการเปิดให้ใช้กับ ChatGPT Codex และ API ภายในไม่กี่สัปดาห์ นักวิจัยด้านความปลอดภัย Alex Stamos ได้เตือน ว่าการปิดกั้นเครื่องมือแนวหน้าหลายตัวอาจเปิดโอกาสให้คู่แข่งในต่างประเทศได้เปรียบในศึก AI
การเปิดตัวครั้งนี้ถือเป็นการปิดท้ายปีแห่งการเข้มงวดด้านการควบคุมไซเบอร์ของบริษัท ตั้งแต่การป้องกันชุดแรกบน GPT-5.2 เมื่อเดือนธันวาคมปีที่แล้ว ไปจนถึงคลาสสิฟายเออร์ที่เข้มงวดขึ้นบน GPT-5.5 สำหรับ GPT-5.6 OpenAI ระบุว่าใช้เวลา GPU เทียบเท่า A100 กว่า 700,000 ชั่วโมงสำหรับการทดสอบโจมตีอัตโนมัติ (automated red-teaming) เพียงอย่างเดียว
อ่านต่อ: XRP ร่วงใกล้ 1 ดอลลาร์ ขณะที่ผู้ซื้อ ETF ทดสอบสภาพตลาดสปอตที่อ่อนแอ





