Ітан Моллік розповів, що протестував ранню версію найпотужнішої AI‑моделі Claude Fable від Anthropic і виявив, що користуватися нею водночас вражає та тривожно.
Тестування Claude Fable
Моллік, професор Вортонської школи бізнесу Пенсільванського університету, у своєму есе у вівторок написав, що рано протестував Claude 5 Fable. Ця система є першою моделлю класу Mythos від Anthropic, випущеною публічно. За його словами, вона з великим відривом перевершила всі відкриті моделі, які він раніше випробовував.
Лише з одного запиту та одного фідбеку модель створила, за словами Молліка, найскладнішу академічну соціологічну статтю, яку він будь-коли бачив від ШІ. Вона також написала 10‑сторінковий римований вірш про стрижку, де кожне слово починалося з літери s.
Щоб побудувати карту часу подорожей, модель запустила дешевші агенти Claude Sonnet і зібрала дані більш ніж про 2 200 рейсів. В окремому запиті вона створила дослідницьке програмне забезпечення за дев’ять з половиною годин. Модель не вміє створювати зображення, тому всі графіки й об’єкти вона будувала за допомогою математики, тоді як її запобіжники блокують завдання, пов’язані з безпекою.
Також читайте: OpenAI Joins $852B IPO Race As Anthropic And SpaceX Charge Ahead
Моллік про контроль
Моллік сказав, що робота з моделлю одночасно принесла задоволення й занепокоєння, тому що він просто просив — і це відбувалося. Модель уважно виконувала його інструкції, написав він, але майже не розкривала сотень дрібних рішень, які приймала.
Він зазначив, що Fable коштує приблизно вдвічі дорожче, ніж модель Opus від Anthropic. Її запобіжники також надто часто переключають систему на слабшу модель, додав він. Свою роль він порівняв із клієнтом, який лише затверджує готову роботу студії.
Рік тому Моллік порівнював роботу з такими інструментами із накладанням закляття чарівником. Тепер, написав він, це закляття стало настільки потужним, що він більше не відчуває себе тим, хто його накладає.
Читайте також: Bitcoin Drawdown Reveals Why Big Buyers Still Want More BTC





