Anthropic diz que pretende dar ao público acesso ao Mythos, its vulnerability-hunting AI (seu modelo de caça a vulnerabilidades), mas apenas quando criar salvaguardas que ainda não existem.
Pontos principais:
- A Anthropic planeja lançar amplamente modelos da classe Mythos depois de primeiro ampliar o acesso para governos dos EUA e aliados.
- A empresa admite que nenhuma organização, incluindo ela própria, criou salvaguardas fortes o bastante para impedir o mau uso.
- O Mythos já sinalizou mais de 23.000 problemas em 1.000 projetos de código aberto, incluindo 6.202 falhas de gravidade alta ou crítica.
Lançamento do Anthropic Mythos
A Anthropic confirmou o plano em uma atualização do Project Glasswing, seu programa de segurança de acesso limitado, e um relatório separado indicou que o cronograma é incerto.
A empresa afirmou que primeiro trabalharia com governos dos EUA e aliados para ampliar o programa. Um lançamento mais amplo de “modelos da classe Mythos” viria em um futuro próximo.
A Anthropic foi direta sobre o risco. Ela afirmou que nenhuma empresa, incluindo a própria Anthropic, desenvolveu salvaguardas fortes o suficiente para impedir que o modelo seja usado de forma indevida e cause danos severos.
Mesmo assim, a empresa espera que ferramentas semelhantes se espalhem rapidamente, prevendo que modelos no nível do Mythos estarão amplamente disponíveis em seis a 12 meses.
O Mythos estreou em abril. A Anthropic afirmou que ele gerou exploits funcionais em 72,4% dos testes, contra quase zero por cento de um modelo Claude anterior.
Também leia: Cisco Research Shows Frontier AI Models Failing Under Multi-Turn Attacks
Achados de vulnerabilidade do Mythos
Desde sua estreia, o modelo analisou mais de 1.000 projetos de código aberto e identificou 23.019 problemas, dos quais 6.202 foram classificados como de gravidade alta ou crítica.
Um achado se destacou. O Mythos descobriu uma falha na biblioteca de criptografia wolfSSL, usada por bilhões de dispositivos, que poderia ter permitido a invasores forjar certificados e se passar por bancos ou provedores de e‑mail. A vulnerabilidade já foi corrigida.
A enxurrada de relatórios tem sobrecarregado as pessoas responsáveis por corrigi-los. Mantenedores de software de código aberto pediram que a Anthropic reduza o ritmo das divulgações, dizendo que o volume supera sua capacidade.
Pesquisadores enxergam um desequilíbrio mais profundo. A Anthropic argumenta que encontrar bugs agora é muito mais fácil do que corrigi-los e a empresa fechou parceria com o projeto Alpha-Omega da Open Source Security Foundation para ajudar mantenedores a priorizar o acúmulo de falhas.
O system card do Claude Mythos prevê que a IA acabará favorecendo os defensores, embora a Anthropic admita que, por enquanto, os invasores podem ter vantagem.
Quando Mythos was first revealed, a Anthropic concedeu acesso a mais de 50 organizações, incluindo Apple, Microsoft e Google, junto com cerca de US$ 100 milhões em créditos de uso, mantendo o modelo afastado do público por causa de sua capacidade de transformar falhas de software em armas.
Leia em seguida: Cardano Whales Seize 67.5% Of ADA Supply, A Six-Year High





