Professor de Wharton testa Mythos AI da Anthropic e o chama de salto real

Professor de Wharton testa Mythos AI da Anthropic e o chama de salto real

Ethan Mollick disse que testou uma versão inicial do modelo de IA mais avançado da Anthropic, o Claude Fable, e o considerou ao mesmo tempo notável e perturbador de usar.

Claude Fable testado

Mollick, professor na Wharton School da Universidade da Pensilvânia, wrote em um ensaio na terça-feira que testou antecipadamente o Claude 5 Fable. O sistema é o primeiro Mythos-class model Anthropic lançado publicamente pela Anthropic. Ele afirmou que o modelo superou, por ampla margem, todos os modelos públicos que já havia testado.

A partir de um único prompt e um único feedback, o modelo produziu o que Mollick chamou de o artigo acadêmico em ciências sociais mais sofisticado que já viu ser gerado por uma IA. Ele também escreveu um poema rimado de 10 páginas sobre um corte de cabelo, com todas as palavras começando com a letra s.

Para construir um mapa de tempo de viagem, o modelo iniciou agentes Claude Sonnet mais baratos e coletou dados de mais de 2.200 voos. Em outro pedido, produziu um software de pesquisa após nove horas e meia. Ele não consegue gerar imagens, então construiu todos os gráficos e objetos usando matemática, enquanto seus sistemas de proteção bloqueiam tarefas de segurança.

Also Read: OpenAI Joins $852B IPO Race As Anthropic And SpaceX Charge Ahead

Mollick sobre controle

Mollick disse que o trabalho parecia ao mesmo tempo encantador e inquietante, porque ele pedia algo e aquilo simplesmente acontecia. O modelo seguiu suas instruções de perto, escreveu ele, mas revelou pouco sobre as centenas de pequenas decisões que tomou.

Ele observou que o Fable custa cerca do dobro do modelo Opus da Anthropic. Seus sistemas de proteção também recorrem com muita frequência a um sistema mais fraco, escreveu. Ele comparou seu papel ao de um cliente que apenas aprova o trabalho finalizado de um estúdio.

Há um ano, Mollick comparou trabalhar com essas ferramentas a lançar um feitiço como um mago. O feitiço ficou poderoso o suficiente, escreveu ele, a ponto de ele não mais se sentir como quem o está lançando.

Read Next: Bitcoin Drawdown Reveals Why Big Buyers Still Want More BTC

Isenção de responsabilidade e aviso de risco: As informações fornecidas neste artigo são apenas para fins educacionais e informativos e são baseadas na opinião do autor. Elas não constituem aconselhamento financeiro, de investimento, jurídico ou tributário. Ativos de criptomoedas são altamente voláteis e sujeitos a alto risco, incluindo o risco de perder todo ou uma quantia substancial do seu investimento. Negociar ou manter ativos cripto pode não ser adequado para todos os investidores. As opiniões expressas neste artigo são exclusivamente do(s) autor(es) e não representam a política oficial ou posição da Yellow, seus fundadores ou seus executivos. Sempre conduza sua própria pesquisa minuciosa (D.Y.O.R.) e consulte um profissional financeiro licenciado antes de tomar qualquer decisão de investimento.
Professor de Wharton testa Mythos AI da Anthropic e o chama de salto real | Yellow.com