Ethan Mollick は、Anthropic の最も先進的なAIモデルである Claude Fable の初期バージョンをテストし、その体験が驚くべきものであると同時に、不安を感じさせるものでもあったと述べた(advanced AI model Claude Fable)。
Claude Fable のテスト
ペンシルベニア大学ウォートン・スクールの教授であるMollickは、火曜日に公開したエッセイの中で(wrote)、Claude 5 Fable を早期にテストしたと記している。これは、Anthropicが一般公開した初のMythosクラスのモデルだ。彼によれば、Fableはこれまで試したあらゆる公開モデルを大きく上回ったという。
1つのプロンプトと1回のフィードバックだけで、Mollickが「AIが書いた中で最も高度な学術的社会科学論文」と呼ぶ成果を生み出した。また、髪型について、すべての単語をsで始める韻文の10ページの詩も生成した。
旅行時間マップを作るために、このモデルはコストの安いClaude Sonnetエージェントを起動し、2,200便以上のフライトデータを収集した。別のリクエストでは、約9時間半かけて研究用ソフトウェアを生成した。画像は作れないため、あらゆるチャートやオブジェクトを数学的に構築し、一方でセキュリティ関連タスクはガードレールによってブロックされる。
あわせて読みたい: OpenAI Joins $852B IPO Race As Anthropic And SpaceX Charge Ahead
制御についてのMollickの見解
Mollickは、依頼したことがそのまま実現していく作業体験が、「楽しい」と同時に「不安」を感じさせるものだったと語る。モデルは彼の指示には忠実に従う一方で、その過程で行われた何百もの細かな判断については、ほとんど明らかにしなかったと書いている。
彼は、FableのコストはAnthropicのOpusモデルのおよそ2倍だと指摘する。また、ガードレールが頻繁に、より弱いシステムにフォールバックしてしまう点も問題視している。自分の役割は、スタジオが仕上げた作品に最終承認を与えるクライアントに近いと感じたという。
1年前、Mollickはこれらのツールを使う体験を「魔法使いが呪文を唱える」ことになぞらえた。しかし今や、その呪文はあまりに強力になり、自分がもはや呪文を唱えている側だとは感じられなくなったと述べている。
次に読む: Bitcoin Drawdown Reveals Why Big Buyers Still Want More BTC





