Ethan Mollick powiedział, że przetestował wczesną wersję najnowszego, najbardziej zaawansowanego modelu SI Anthropic, Claude Fable, i uznał go za jednocześnie niezwykły i niepokojący w użyciu. Zobacz: advanced AI model Claude Fable
Test Claude Fable
Mollick, profesor w Wharton School na Uniwersytecie Pensylwanii, w tekście opublikowanym we wtorek napisał, że wcześnie testował Claude 5 Fable. System jest pierwszym publicznie udostępnionym modelem klasy Mythos firmy Anthropic, zobacz: Mythos-class model Anthropic. Jak stwierdził, model zdecydowanie pokonał każdy publiczny model, który wcześniej wypróbowywał.
Na podstawie pojedynczego polecenia i jednej informacji zwrotnej model stworzył, jak ujął to Mollick, najbardziej zaawansowaną akademicką pracę z zakresu nauk społecznych, jaką widział od SI. Napisał też dziesięciostronicowy wiersz rymowany o strzyżeniu, w którym każde słowo zaczynało się na literę „s”.
Aby zbudować mapę czasu podróży, model uruchomił tańsze agenty Claude Sonnet i zebrał dane dotyczące ponad 2200 lotów. Na osobne żądanie przygotował oprogramowanie badawcze w ciągu dziewięciu i pół godziny. Nie potrafi tworzyć obrazów, więc wszystkie wykresy i obiekty konstruował za pomocą matematyki, a jego zabezpieczenia blokują zadania związane z bezpieczeństwem.
Also Read: OpenAI Joins $852B IPO Race As Anthropic And SpaceX Charge Ahead
Mollick o kontroli
Mollick stwierdził, że praca z modelem była zarazem zachwycająca i niepokojąca, ponieważ prosił o coś – i to po prostu się działo. Model ściśle podążał za jego instrukcjami, jak napisał, lecz ujawniał niewiele z setek drobnych decyzji, które podejmował.
Zauważył, że Fable kosztuje około dwa razy więcej niż model Opus Anthropic. Według niego zabezpieczenia zbyt często wycofują się też do słabszego systemu. Swoją rolę porównał do klienta, który tylko zatwierdza gotowe dzieło studia.
Rok temu Mollick porównywał pracę z takimi narzędziami do rzucania zaklęcia jako czarodziej. Teraz, jak napisał, zaklęcie stało się na tyle potężne, że nie czuje się już jak ten, który je rzuca.
Read Next: Bitcoin Drawdown Reveals Why Big Buyers Still Want More BTC





