โมเดล GPT-5.6 ที่ทรงพลังที่สุดของ OpenAI มาถึงแล้วแต่ยังอยู่หลังประตูล็อก

profile-alexey-bondarev
Alexey Bondarev1 ชั่วโมงที่แล้ว
โมเดล GPT-5.6 ที่ทรงพลังที่สุดของ OpenAI มาถึงแล้วแต่ยังอยู่หลังประตูล็อก

OpenAI ได้พรีวิวตระกูล GPT-5.6 ที่มีสามโมเดล เมื่อวันศุกร์ โดยจับคู่การพัฒนาอย่างก้าวกระโดดด้านโค้ด ชีววิทยา และความปลอดภัยไซเบอร์ เข้ากับการเปิดให้ใช้งานอย่างจำกัดเฉพาะพาร์ตเนอร์กลุ่มเล็ก ๆ ในตอนนี้

ประเด็นสำคัญ:

  • GPT-5.6 เปิดตัวในรูปแบบตระกูลสามระดับ โดยมี Sol เป็นเรือธง Terra เป็นตัวเลือกสมดุล และ Luna ถูกออกแบบมาเพื่อความเร็ว
  • โหมด max และ ultra แบบใหม่ช่วยให้ Sol ใช้เหตุผลได้นานขึ้น และแบ่งงานยาก ๆ ออกเป็นซับเอเจนต์แบบขนาน
  • OpenAI จัดให้ทั้งสามระดับมีความเสี่ยงสูงด้านไซเบอร์และชีววิทยา ทำให้การเปิดให้ใช้งานวงกว้างต้องรอไปก่อน

ตระกูล GPT-5.6 เน้นงานโค้ดและงานไซเบอร์

บริษัทได้เปิดตัว Sol ในฐานะโมเดลที่ทรงพลังที่สุดของตนจนถึงปัจจุบัน Terra เป็นระดับใช้งานทั่วไปที่สมดุลและตั้งราคาประมาณครึ่งหนึ่งของรุ่นก่อนหน้า และ Luna เป็นตัวเลือกที่เร็วที่สุดที่ราคา 1 ดอลลาร์ต่อโทเคนอินพุตหนึ่งล้านโทเคน ระบบการตั้งชื่อแบบใหม่ใช้ตัวเลขแทนรุ่นของโมเดล ขณะที่ชื่อแต่ละตัวแทนระดับความสามารถที่ทนทาน แต่ละระดับสามารถพัฒนาในตารางเวลาของตนเอง ทำให้นักพัฒนามองเห็นทางเลือกที่ชัดเจนขึ้นระหว่างความเร็ว ความลึก และราคา

GPT-5.6 ยังเปิดตัวสองวิธีใหม่ในการผลักดันให้ Sol ทำงานงานยาวหลายขั้นตอนได้หนักขึ้น การตั้งค่าแบบ max ทำให้โมเดลมีเวลา “คิด” มากขึ้น ส่วนโหมด ultra จะแบ่ง งานซับซ้อนออกไปยังซับเอเจนต์หลายตัวที่รันแบบขนาน ก่อนรวมผลลัพธ์เข้าด้วยกัน

OpenAI ยังวางแผนจะรัน Sol บนชิป Cerebras ด้วยความเร็วสูงสุด 750 โทเคนต่อวินาทีในเดือนกรกฎาคม

Sol ทำสถิติ คะแนนสูงใหม่บน Terminal-Bench 2.1 แบบทดสอบงานบรรทัดคำสั่งที่ต้องอาศัยการวางแผนและการประสานงานกับเครื่องมือ ในการวิเคราะห์จีโนมิกส์ Sol ทำคะแนนเหนือ GPT-5.5 เล็กน้อยขณะใช้โทเคนน้อยกว่า

ในแบบทดสอบช่องโหว่ตัวหนึ่ง Sol ทำได้สูสี กับ Mythos Preview ของ Anthropic โดยใช้โทเคนเอาต์พุตราวหนึ่งในสาม

อ่านเพิ่มเติม: สถิติกระเป๋าเงินของ Chainlink ทำให้การเด้งกลับสู่ 9 ดอลลาร์ของ LINK กลายเป็นบททดสอบหลัก

ระดับความเสี่ยงของ ChatGPT กำลังกำหนดการเข้าถึง AI ใหม่

OpenAI ได้จัดระดับ โมเดลทั้งสามว่าเป็นความเสี่ยงสูงทั้งด้านการใช้ในทางไซเบอร์และชีววิทยา ซึ่งถือเป็นครั้งแรกสำหรับระดับที่เล็กลงและราคาถูกลงของบริษัท บริษัทระบุว่าไม่มีโมเดลใดถึงระดับวิกฤตที่จะต้องใช้ข้อจำกัดสูงสุด และ Sol ทำผลงานได้ดีกว่าในการค้นหาและแก้ไขช่องโหว่มากกว่าการรันการโจมตีเต็มรูปแบบ

การจัดอันดับนั้นช่วยอธิบายว่าทำไมการเข้าถึงจึงยังคงแคบอยู่ในตอนนี้ มีเพียงประมาณ 20 องค์กรที่ผ่านการรับรองโดยรัฐบาลที่สามารถรันโมเดลเหล่านี้ได้ในช่วงพรีวิว โดยสัญญาว่าจะขยายการเปิดให้ใช้กับ ChatGPT Codex และ API ภายในไม่กี่สัปดาห์ นักวิจัยด้านความปลอดภัย Alex Stamos ได้เตือน ว่าการปิดกั้นเครื่องมือแนวหน้าหลายตัวอาจเปิดโอกาสให้คู่แข่งในต่างประเทศได้เปรียบในศึก AI

การเปิดตัวครั้งนี้ถือเป็นการปิดท้ายปีแห่งการเข้มงวดด้านการควบคุมไซเบอร์ของบริษัท ตั้งแต่การป้องกันชุดแรกบน GPT-5.2 เมื่อเดือนธันวาคมปีที่แล้ว ไปจนถึงคลาสสิฟายเออร์ที่เข้มงวดขึ้นบน GPT-5.5 สำหรับ GPT-5.6 OpenAI ระบุว่าใช้เวลา GPU เทียบเท่า A100 กว่า 700,000 ชั่วโมงสำหรับการทดสอบโจมตีอัตโนมัติ (automated red-teaming) เพียงอย่างเดียว

อ่านต่อ: XRP ร่วงใกล้ 1 ดอลลาร์ ขณะที่ผู้ซื้อ ETF ทดสอบสภาพตลาดสปอตที่อ่อนแอ

ข้อจำกัดความรับผิดชอบและคำเตือนความเสี่ยง: ข้อมูลที่ให้ไว้ในบทความนี้มีไว้เพื่อการศึกษาและการให้ข้อมูลเท่านั้น และอิงตามความเห็นของผู้เขียน ไม่ถือเป็นคำแนะนำทางการเงิน การลงทุน กฎหมาย หรือภาษี สินทรัพย์คริปโตมีความผันผวนสูงและมีความเสี่ยงสูง รวมถึงความเสี่ยงในการสูญเสียเงินลงทุนทั้งหมดหรือส่วนใหญ่ การซื้อขายหรือการถือครองสินทรัพย์คริปโตอาจไม่เหมาะสมสำหรับนักลงทุนทุกคน ความเห็นที่แสดงในบทความนี้เป็นของผู้เขียนเท่านั้น และไม่ได้แทนนโยบายหรือตำแหน่งอย่างเป็นทางการของ Yellow ผู้ก่อตั้ง หรือผู้บริหาร ควรทำการวิจัยอย่างละเอียดด้วยตนเอง (D.Y.O.R.) และปรึกษาผู้เชี่ยวชาญทางการเงินที่ได้รับใบอนุญาตก่อนตัดสินใจลงทุนใดๆ เสมอ
ข่าวที่เกี่ยวข้อง
บทความวิจัยที่เกี่ยวข้อง
บทความการเรียนรู้ที่เกี่ยวข้อง
โมเดล GPT-5.6 ที่ทรงพลังที่สุดของ OpenAI มาถึงแล้วแต่ยังอยู่หลังประตูล็อก | Yellow.com