Професор Уортона випробував Mythos AI від Anthropic і назвав це справжнім стрибком

Професор Уортона випробував Mythos AI від Anthropic і назвав це справжнім стрибком

Ітан Моллік розповів, що протестував ранню версію найпотужнішої AI‑моделі Claude Fable від Anthropic і виявив, що користуватися нею водночас вражає та тривожно.

Тестування Claude Fable

Моллік, професор Вортонської школи бізнесу Пенсільванського університету, у своєму есе у вівторок написав, що рано протестував Claude 5 Fable. Ця система є першою моделлю класу Mythos від Anthropic, випущеною публічно. За його словами, вона з великим відривом перевершила всі відкриті моделі, які він раніше випробовував.

Лише з одного запиту та одного фідбеку модель створила, за словами Молліка, найскладнішу академічну соціологічну статтю, яку він будь-коли бачив від ШІ. Вона також написала 10‑сторінковий римований вірш про стрижку, де кожне слово починалося з літери s.

Щоб побудувати карту часу подорожей, модель запустила дешевші агенти Claude Sonnet і зібрала дані більш ніж про 2 200 рейсів. В окремому запиті вона створила дослідницьке програмне забезпечення за дев’ять з половиною годин. Модель не вміє створювати зображення, тому всі графіки й об’єкти вона будувала за допомогою математики, тоді як її запобіжники блокують завдання, пов’язані з безпекою.

Також читайте: OpenAI Joins $852B IPO Race As Anthropic And SpaceX Charge Ahead

Моллік про контроль

Моллік сказав, що робота з моделлю одночасно принесла задоволення й занепокоєння, тому що він просто просив — і це відбувалося. Модель уважно виконувала його інструкції, написав він, але майже не розкривала сотень дрібних рішень, які приймала.

Він зазначив, що Fable коштує приблизно вдвічі дорожче, ніж модель Opus від Anthropic. Її запобіжники також надто часто переключають систему на слабшу модель, додав він. Свою роль він порівняв із клієнтом, який лише затверджує готову роботу студії.

Рік тому Моллік порівнював роботу з такими інструментами із накладанням закляття чарівником. Тепер, написав він, це закляття стало настільки потужним, що він більше не відчуває себе тим, хто його накладає.

Читайте також: Bitcoin Drawdown Reveals Why Big Buyers Still Want More BTC

Відмова від відповідальності та попередження про ризики: Інформація, надана в цій статті, призначена лише для освітніх та інформаційних цілей і базується на думці автора. Вона не є фінансовою, інвестиційною, правовою чи податковою консультацією. Криптоактиви є надзвичайно волатильними та піддаються високому ризику, включаючи ризик втрати всіх або значної частини ваших інвестицій. Торгівля або утримання криптоактивів може не підходити для всіх інвесторів. Думки, висловлені в цій статті, належать виключно автору(ам) і не представляють офіційну політику чи позицію Yellow, її засновників або керівників. Завжди проводьте власне ретельне дослідження (D.Y.O.R.) та консультуйтесь з ліцензованим фінансовим фахівцем перед прийняттям будь-яких інвестиційних рішень.
Останні новини
Показати всі новини
Схожі новини
Схожі дослідницькі статті
Схожі навчальні матеріали