Anthropic abrirá o Claude Mythos ao público assim que as salvaguardas alcançarem o modelo, talvez em 12 meses

Anthropic abrirá o Claude Mythos ao público assim que as salvaguardas alcançarem o modelo, talvez em 12 meses

Anthropic diz que pretende dar ao público acesso ao Mythos, its vulnerability-hunting AI (seu modelo de caça a vulnerabilidades), mas apenas quando criar salvaguardas que ainda não existem.

Pontos principais:

  • A Anthropic planeja lançar amplamente modelos da classe Mythos depois de primeiro ampliar o acesso para governos dos EUA e aliados.
  • A empresa admite que nenhuma organização, incluindo ela própria, criou salvaguardas fortes o bastante para impedir o mau uso.
  • O Mythos já sinalizou mais de 23.000 problemas em 1.000 projetos de código aberto, incluindo 6.202 falhas de gravidade alta ou crítica.

Lançamento do Anthropic Mythos

A Anthropic confirmou o plano em uma atualização do Project Glasswing, seu programa de segurança de acesso limitado, e um relatório separado indicou que o cronograma é incerto.

A empresa afirmou que primeiro trabalharia com governos dos EUA e aliados para ampliar o programa. Um lançamento mais amplo de “modelos da classe Mythos” viria em um futuro próximo.

A Anthropic foi direta sobre o risco. Ela afirmou que nenhuma empresa, incluindo a própria Anthropic, desenvolveu salvaguardas fortes o suficiente para impedir que o modelo seja usado de forma indevida e cause danos severos.

Mesmo assim, a empresa espera que ferramentas semelhantes se espalhem rapidamente, prevendo que modelos no nível do Mythos estarão amplamente disponíveis em seis a 12 meses.

O Mythos estreou em abril. A Anthropic afirmou que ele gerou exploits funcionais em 72,4% dos testes, contra quase zero por cento de um modelo Claude anterior.

Também leia: Cisco Research Shows Frontier AI Models Failing Under Multi-Turn Attacks

Achados de vulnerabilidade do Mythos

Desde sua estreia, o modelo analisou mais de 1.000 projetos de código aberto e identificou 23.019 problemas, dos quais 6.202 foram classificados como de gravidade alta ou crítica.

Um achado se destacou. O Mythos descobriu uma falha na biblioteca de criptografia wolfSSL, usada por bilhões de dispositivos, que poderia ter permitido a invasores forjar certificados e se passar por bancos ou provedores de e‑mail. A vulnerabilidade já foi corrigida.

A enxurrada de relatórios tem sobrecarregado as pessoas responsáveis por corrigi-los. Mantenedores de software de código aberto pediram que a Anthropic reduza o ritmo das divulgações, dizendo que o volume supera sua capacidade.

Pesquisadores enxergam um desequilíbrio mais profundo. A Anthropic argumenta que encontrar bugs agora é muito mais fácil do que corrigi-los e a empresa fechou parceria com o projeto Alpha-Omega da Open Source Security Foundation para ajudar mantenedores a priorizar o acúmulo de falhas.

O system card do Claude Mythos prevê que a IA acabará favorecendo os defensores, embora a Anthropic admita que, por enquanto, os invasores podem ter vantagem.

Quando Mythos was first revealed, a Anthropic concedeu acesso a mais de 50 organizações, incluindo Apple, Microsoft e Google, junto com cerca de US$ 100 milhões em créditos de uso, mantendo o modelo afastado do público por causa de sua capacidade de transformar falhas de software em armas.

Leia em seguida: Cardano Whales Seize 67.5% Of ADA Supply, A Six-Year High

Isenção de responsabilidade e aviso de risco: As informações fornecidas neste artigo são apenas para fins educacionais e informativos e são baseadas na opinião do autor. Elas não constituem aconselhamento financeiro, de investimento, jurídico ou tributário. Ativos de criptomoedas são altamente voláteis e sujeitos a alto risco, incluindo o risco de perder todo ou uma quantia substancial do seu investimento. Negociar ou manter ativos cripto pode não ser adequado para todos os investidores. As opiniões expressas neste artigo são exclusivamente do(s) autor(es) e não representam a política oficial ou posição da Yellow, seus fundadores ou seus executivos. Sempre conduza sua própria pesquisa minuciosa (D.Y.O.R.) e consulte um profissional financeiro licenciado antes de tomar qualquer decisão de investimento.
Anthropic abrirá o Claude Mythos ao público assim que as salvaguardas alcançarem o modelo, talvez em 12 meses | Yellow.com