Професор Уортона випробував Mythos AI від Anthropic і назвав це справжнім стрибком уперед

Ейтан Моллік сказав, що протестував ранню версію найновішої моделі Anthropic – найпросунутішої AI‑моделі Claude Fable – і виявив, що її і вражаюче, і тривожно використовувати.

Тестування Claude Fable

Моллік, професор Уортонської школи бізнесу Університету Пенсільванії, у статті, опублікованій у вівторок, написав, що рано протестував Claude 5 Fable. Це перша модель класу Mythos Anthropic, яку компанія публічно випустила. За його словами, вона з великим відривом перевершила всі публічні моделі, які він пробував.

З одного запиту й одного фідбеку вона створила те, що Моллік назвав найскладнішим академічним дослідженням у галузі соціальних наук, яке він будь‑коли бачив від ШІ. Вона також написала 10‑сторінкову римовану поему про стрижку, де кожне слово починалося з літери s.

Щоб побудувати карту часу подорожей, модель запустила дешевші агенти Claude Sonnet і зібрала дані більш ніж про 2 200 рейсів. Інший запит дав дослідницьке програмне забезпечення після дев’яти з половиною годин роботи. Вона не може створювати зображення, тож будувала всі графіки й об’єкти за допомогою математики, а її запобіжники блокують завдання, пов’язані з безпекою.

Also Read: OpenAI Joins $852B IPO Race As Anthropic And SpaceX Charge Ahead

Моллік про контроль

Моллік сказав, що робота здавалась водночас захопливою й тривожною, тому що він просто просив про щось – і це відбувалося. Модель точно дотримувалася його інструкцій, написав він, але майже не розкривала сотні дрібних рішень, які приймала.

Він зауважив, що Fable коштує приблизно вдвічі дорожче, ніж модель Anthropic Opus. Її запобіжники також надто часто відкатуються до слабшої системи, додав він. Свою роль він порівняв із клієнтом, який лише затверджує вже готову роботу студії.

Рік тому Моллік порівнював роботу з такими інструментами з накладанням чарів, як чарівник. Закляття стало настільки сильним, написав він, що він більше не відчуває себе тим, хто його накладає.