ウォートン教授がAnthropicのMythos AIを試用、「本当の飛躍」と評価

イーサン・モルリック（Ethan Mollick）は、Anthropicの最も先進的なAIモデルの一つである初期版のClaude Fableをテストし、その体験が驚嘆すべきであると同時に不安を感じさせるものだったと語った。

Claude Fable のテスト

ペンシルベニア大学ウォートン・スクールの教授であるモルリックは、火曜日に公開したエッセイの中で、Claude 5 Fable を早期にテストしたと記している。このシステムは、Anthropicが一般向けに公開した初のMythosクラスモデルだ。彼によれば、これまで試したあらゆる公開モデルを大きく上回ったという。

1つのプロンプトと1回のフィードバックだけで、モルリックが「AIから見た中で最も高度な学術的社会科学論文」と呼ぶ成果を生成した。また、「髪型（ヘアカット）」について、すべての単語が s から始まる10ページの韻を踏んだ詩も書いた。

旅行時間マップを作成するために、このモデルはより安価な Claude Sonnet エージェントを起動し、2,200便以上のフライトデータを収集した。別のリクエストでは、約9時間半かけて研究用ソフトウェアを生成した。画像を作ることはできないため、あらゆるグラフやオブジェクトを数学的手法で構築し、一方でセキュリティ関連のタスクはガードレールによりブロックされる。

モルリックが語る「制御」

モルリックは、この作業は「楽しいが不気味」な体験だったと述べている。自分が何かを頼むと、それがただ実行されてしまうからだ。モデルは彼の指示に忠実に従ったが、その裏で行われた何百もの細かな判断については、ほとんど何も明かさなかったという。

彼は、Fableの利用コストはAnthropicの Opus モデルのおよそ2倍だと指摘する。また、ガードレールが頻繁に、より弱いシステムへフォールバックしてしまうとも書いている。自分の役割は、スタジオが仕上げた作品にサインオフするクライアントのようなものだと例えた。

1年前、モルリックは、こうしたツールを使うことを「魔法使いが呪文を唱える」ことになぞらえていた。だが今や呪文はあまりに強力になり、自分が呪文を唱えている当人だとは、もはや感じられなくなっていると述べている。

次に読む: Bitcoin Drawdown Reveals Why Big Buyers Still Want More BTC

ウォートン教授がAnthropicのMythos AIを試用、 「本当の飛躍」と評価

Claude Fable のテスト

モルリックが語る「制御」

ウォートン教授がAnthropicのMythos AIを試用、「本当の飛躍」と評価