ศาสตราจารย์วอร์ตันทดลองใช้ Mythos AI ของ Anthropic ชี้เป็นก้าวกระโดดครั้งใหญ่จริง ๆ

อีธาน มอลลิก (Ethan Mollick) ระบุว่าเขาได้ทดสอบเวอร์ชันแรก ๆ ของโมเดล AI ขั้นสูงสุดของ Anthropic อย่าง Claude Fable และพบว่ามันทั้งน่าทึ่งและน่าหวั่นใจไปพร้อมกันเมื่อใช้งาน

การทดสอบ Claude Fable

มอลลิก ศาสตราจารย์ที่วอร์ตัน สกูล แห่งมหาวิทยาลัยเพนซิลเวเนีย เขียน ในบทความเมื่อวันอังคารว่าเขาได้ทดสอบ Claude 5 Fable ตั้งแต่ช่วงต้น ระบบนี้เป็นโมเดลระดับ Mythos ตัวแรกที่ Anthropic เปิดเผยต่อสาธารณะ เขาระบุว่ามันเอาชนะโมเดลสาธารณะทุกตัวที่เขาเคยลองได้แบบทิ้งห่าง

จากเพียงพรอมป์ตเดียวและฟีดแบ็กหนึ่งครั้ง โมเดลสร้างงานเขียนเชิงวิชาการด้านสังคมศาสตร์ที่มอลลิกบอกว่า เป็นงานวิจัยที่ซับซ้อนที่สุดจาก AI ที่เขาเคยเห็น นอกจากนี้ยังเขียนบทกวีเสียงสัมผัสยาว 10 หน้าเกี่ยวกับการตัดผม โดยทุกคำขึ้นต้นด้วยตัวอักษร s

เพื่อสร้างแผนที่เวลาเดินทาง โมเดลได้เรียกใช้เอเจนต์ Claude Sonnet ที่มีราคาถูกกว่าและรวบรวมข้อมูลเที่ยวบินมากกว่า 2,200 เที่ยว อีกคำขอหนึ่งทำให้มันสร้างซอฟต์แวร์วิจัยขึ้นมาได้ภายในเวลาเก้าชั่วโมงครึ่ง โมเดลไม่สามารถสร้างรูปภาพได้ จึงสร้างกราฟและวัตถุทุกอย่างด้วยคณิตศาสตร์ ขณะที่รั้วป้องกัน (guardrails) ของมันบล็อกงานด้านความปลอดภัย

อ่านเพิ่มเติม: OpenAI Joins $852B IPO Race As Anthropic And SpaceX Charge Ahead

มอลลิกกับประเด็นเรื่องการควบคุม

มอลลิกกล่าวว่างานที่ได้ทำให้รู้สึกทั้งเพลิดเพลินและน่ากังวล เพราะเขาเพียงแค่ขอ แล้วทุกอย่างก็เกิดขึ้น โมเดลทำตามคำสั่งของเขาอย่างใกล้ชิด เขาเขียนไว้เช่นนั้น แต่แทบไม่เปิดเผยให้เห็นถึงการตัดสินใจเล็ก ๆ น้อย ๆ จำนวนหลายร้อยครั้งที่มันทำลงไป

เขาระบุเพิ่มเติมว่า Fable มีค่าใช้จ่ายราวสองเท่าของ โมเดล Opus ของ Anthropic และรั้วป้องกันของมันก็มักจะถอยกลับไปใช้ระบบที่อ่อนแอกว่าบ่อยเกินไป เขาเปรียบเทียบบทบาทของตัวเองว่าเหมือนลูกค้าที่มีหน้าที่เซ็นรับรองผลงานสุดท้ายของสตูดิโอ

เมื่อหนึ่งปีก่อน มอลลิกเคยเปรียบการทำงานกับเครื่องมือเหล่านี้ ว่าเหมือนการร่ายเวทมนตร์ของพ่อมด แต่ตอนนี้เขาเขียนว่า เวทมนตร์ได้ทรงพลังมากเสียจนเขาไม่รู้สึกว่า ตัวเองเป็นคนที่กำลังร่ายคาถาอยู่อีกต่อไป

อ่านถัดไป: Bitcoin Drawdown Reveals Why Big Buyers Still Want More BTC