Claude Opus 4.7 se Aproxima do Lançamento, mas a IA Mais Avançada da Anthropic Continua Fora de Alcance

Claude Opus 4.7 se Aproxima do Lançamento, mas a IA Mais Avançada da Anthropic Continua Fora de Alcance

Anthropic está se preparando para lançar o Claude Opus 4.7 e uma ferramenta de design com IA para criação de sites e apresentações, um movimento que abalou as ações da Adobe, Wix e Figma na segunda-feira.

Detalhes do Lançamento do Opus 4.7

The Information reported em 14 de abril que ambos os produtos poderiam ser lançados já nesta semana, citando uma pessoa com conhecimento dos planos. A ferramenta de design aceita prompts em inglês simples e tem como alvo tanto desenvolvedores quanto usuários não técnicos.

Isso puts a Anthropic em concorrência direta com startups como Gamma e o Stitch do Google.

O Opus 4.7 nem é o modelo mais avançado da Anthropic.

Essa distinção pertence a Claude Mythos, um sistema focado em cibersegurança que a empresa está distribuindo apenas para empresas de segurança selecionadas por meio do Project Glasswing, mantendo-o distante do público em geral.

Also Read: World Liberty Financial Demands Insiders Burn 10% Of Their WLFI Or Stay Locked

Crise de Benchmarks de IA e Mythos

A OpenAI recentemente declarou o SWE-bench Verified, o principal benchmark de programação, como “contaminado” depois de descobrir que modelos de fronteira haviam memorizado suas soluções durante o treinamento. Mesmo assim, os laboratórios continuam citando esses mesmos testes em comparações de modelos.

Uma avaliação separada, o ARC-AGI-3, ressaltou a distância entre os sistemas de IA e o raciocínio humano. O Gemini marcou 0,37% e o GPT-5.4 atingiu 0,26%, enquanto humanos alcançaram 100%. Sem um cartão de modelo detalhado da Anthropic, as alegações sobre as melhorias do Opus 4.7 permanecem difíceis de verificar de forma independente.

O AI Security Institute do Reino Unido recentemente evaluated Mythos Preview e constatou que ele pode executar autonomamente ciberataques sofisticados em taxas que nenhum outro modelo conseguiu igualar. Ele se tornou a primeira IA a completar “The Last Ones”, uma simulação de ataque a rede corporativa em 32 etapas que normalmente leva equipes humanas de red team 20 horas.

Read Next: Binance Launches Built-In Chat Feature To Merge Messaging With Crypto Transfers

Disclaimer e aviso de risco: As informações fornecidas neste artigo são apenas para fins educacionais e informativos e baseiam-se na opinião do autor. Não constituem aconselhamento financeiro, de investimento, legal ou fiscal. Os ativos de criptomoeda são altamente voláteis e sujeitos a alto risco, incluindo o risco de perder todo ou uma quantia substancial do seu investimento. Negociar ou deter ativos cripto pode não ser adequado para todos os investidores. As opiniões expressas neste artigo são exclusivamente do(s) autor(es) e não representam a política oficial ou posição da Yellow, seus fundadores ou executivos. Sempre conduza a sua própria pesquisa minuciosa (D.Y.O.R.) e consulte um profissional financeiro licenciado antes de tomar qualquer decisão de investimento.