Anthropic abrirá o Claude Mythos ao público assim que as salvaguardas alcançarem o nível necessário, talvez em 12 meses

Anthropic abrirá o Claude Mythos ao público assim que as salvaguardas alcançarem o nível necessário, talvez em 12 meses

Anthropic diz que pretende dar ao público acesso ao modelo Mythos, its vulnerability-hunting AI, mas só depois de construir salvaguardas que ainda não existem.

Pontos principais:

  • A Anthropic planeja lançar amplamente modelos da classe Mythos após primeiro ampliar o acesso a governos dos EUA e aliados.
  • A empresa admite que nenhuma organização, incluindo ela própria, construiu salvaguardas fortes o suficiente para impedir o uso indevido.
  • O Mythos sinalizou mais de 23.000 problemas em 1.000 projetos de código aberto, incluindo 6.202 falhas de alta ou crítica gravidade.

Lançamento do Anthropic Mythos

A Anthropic confirmou o plano em uma atualização do Project Glasswing, seu programa de segurança de acesso limitado, e um relatório separado indicou que o cronograma é incerto.

A empresa afirmou que primeiro trabalharia com governos dos EUA e aliados para ampliar o programa. Um lançamento mais amplo de “modelos da classe Mythos” viria em seguida, em um futuro próximo.

A Anthropic foi direta quanto ao risco. Ela afirmou que nenhuma empresa, incluindo a própria Anthropic, construiu salvaguardas fortes o suficiente para impedir que o modelo seja usado de forma indevida e cause danos graves.

Ainda assim, a empresa espera que ferramentas semelhantes se espalhem rapidamente, prevendo que modelos em nível Mythos se tornem amplamente disponíveis em seis a 12 meses.

Mythos estreou em abril. A Anthropic disse que ele gerou exploits funcionais em 72,4% dos testes, contra quase zero por cento de um modelo Claude anterior.

Também leia: Cisco Research Shows Frontier AI Models Failing Under Multi-Turn Attacks

Descobertas de vulnerabilidades do Mythos

Desde a estreia, o modelo analisou mais de 1.000 projetos de código aberto e identificou 23.019 problemas, dos quais 6.202 foram classificados como de alta ou crítica severidade.

Uma descoberta se destacou. O Mythos encontrou uma falha na biblioteca de criptografia wolfSSL, usada por bilhões de dispositivos, que poderia permitir a invasores forjar certificados e se passar por bancos ou provedores de e‑mail. A falha já foi corrigida.

A enxurrada de relatórios sobrecarregou as pessoas responsáveis por corrigi-los. Mantenedores de projetos de código aberto pediram que a Anthropic diminuísse o ritmo das divulgações, dizendo que o volume supera sua capacidade.

Pesquisadores veem um desequilíbrio mais profundo. A Anthropic argumenta que encontrar bugs agora é muito mais fácil do que corrigi-los e a empresa se associou ao projeto Alpha-Omega da Open Source Security Foundation para ajudar os mantenedores a priorizar o acúmulo de falhas.

O system card do Claude Mythos prevê que a IA acabará favorecendo os defensores, embora a Anthropic reconheça que, por enquanto, os atacantes podem estar em vantagem.

Quando Mythos was first revealed, a Anthropic deu a mais de 50 organizações, incluindo Apple, Microsoft e Google, acesso ao modelo, juntamente com cerca de US$ 100 milhões em créditos de uso, retendo o modelo do público devido à sua capacidade de transformar falhas de software em armas.

Leia a seguir: Cardano Whales Seize 67.5% Of ADA Supply, A Six-Year High

Disclaimer e aviso de risco: As informações fornecidas neste artigo são apenas para fins educacionais e informativos e baseiam-se na opinião do autor. Não constituem aconselhamento financeiro, de investimento, legal ou fiscal. Os ativos de criptomoeda são altamente voláteis e sujeitos a alto risco, incluindo o risco de perder todo ou uma quantia substancial do seu investimento. Negociar ou deter ativos cripto pode não ser adequado para todos os investidores. As opiniões expressas neste artigo são exclusivamente do(s) autor(es) e não representam a política oficial ou posição da Yellow, seus fundadores ou executivos. Sempre conduza a sua própria pesquisa minuciosa (D.Y.O.R.) e consulte um profissional financeiro licenciado antes de tomar qualquer decisão de investimento.
Anthropic abrirá o Claude Mythos ao público assim que as salvaguardas alcançarem o nível necessário, talvez em 12 meses | Yellow.com