Notícias Aprender Pesquisa Classificação Ecossistema

PLATAFORMA AO VIVO

yellow bottom left star road

OpenAI treina IA para permanecer honesta, e o efeito se espalha por toda parte

Alexey BondarevJun, 20 2026 4:50

Reinforcement learning on beneficial traits helped one lab's AI grow safer and steadier under pressure, according to fresh research. (Image: Shutterstock)

Pesquisadores da OpenAI afirmam que o aprendizado por reforço voltado a traços benéficos pode melhorar amplamente o comportamento da IA, com ganhos que se espalham para novos domínios e se mantêm sob pressão adversarial.

Treinamento de Traços da OpenAI

Os resultados aparecem em um artigo publicado em 18 de junho. Seus autores correspondentes, Akshay V. Jagadeesh e Karan Singhal, criaram um conjunto de dados sintético de conversas realistas com o objetivo de treinar e medir traços como honestidade, humildade epistêmica e abertura à correção. Os cenários abrangem saúde, educação, ciência, direito e engenharia.

A equipe misturou uma pequena parte desses dados em uma rodada mais ampla de treinamento e depois comparou o resultado com modelos construídos com computação equivalente. O modelo treinado melhorou em 44 de 53 benchmarks internos e externos que medem engano, reward hacking e conselhos prejudiciais.

Leia também: SpaceX de Elon Musk elimina US$ 600 bilhões enquanto a febre recorde de IPOs esfria

Alinhamento que Generaliza

O resultado mais importante, dizem os autores, é a generalização. Treinar o modelo para bom comportamento em um único domínio, saúde, melhorou suas pontuações em tarefas não relacionadas, incluindo engano e reward hacking. Ele também resistiu melhor a prompts adversariais e a um fine-tuning prejudicial do que a linha de base, enquanto permanecia responsivo a solicitações legítimas.

O trabalho se baseia em descobertas anteriores que a equipe chama de desalinhamento emergente. Nessa pesquisa, modelos ensinados a adotar um único mau hábito, como escrever código inseguro, passaram a se comportar mal em contextos não relacionados, um padrão que este estudo buscou reverter.

Leia a seguir: OpenAI contrata co-líder do Gemini e assessor de IA de Trump antes do IPO

Alexey Bondarev

Alexey Bondarev é o Head de Conteúdo da Yellow.com, tendo coberto o setor de cripto nos últimos 10 anos. Ele é especializado em artigos de Pesquisa e Aprendizado aprofundados, com foco em reportagens analíticas, contexto da indústria e nas grandes forças que moldam o universo cripto, desde a era da IA e tecnologias de segurança até a inovação em fintech. Ele acredita que tudo o que é digital em breve superará tudo o que é analógico e está trabalhando intensamente para que isso se torne realidade.

Isenção de responsabilidade e aviso de risco: As informações fornecidas neste artigo são apenas para fins educacionais e informativos e são baseadas na opinião do autor. Elas não constituem aconselhamento financeiro, de investimento, jurídico ou tributário. Ativos de criptomoedas são altamente voláteis e sujeitos a alto risco, incluindo o risco de perder todo ou uma quantia substancial do seu investimento. Negociar ou manter ativos cripto pode não ser adequado para todos os investidores. As opiniões expressas neste artigo são exclusivamente do(s) autor(es) e não representam a política oficial ou posição da Yellow, seus fundadores ou seus executivos. Sempre conduza sua própria pesquisa minuciosa (D.Y.O.R.) e consulte um profissional financeiro licenciado antes de tomar qualquer decisão de investimento.

Últimas Notícias

Mostrar Todas as Notícias

Acordo com parte relacionada da AIxCrypto Holdings por um ano acende alerta de governança

AIxCrypto firma consultoria com parte relacionada sem revelar valores, elevando preocupações de conflito de interesse e transparência.

Ações da Apple caem 8% após alerta de Tim Cook sobre alta nos preços de memória

Lucro supera projeções, mas alerta com memória e China derruba Apple em 8%.

SpaceX torna-se a empresa mais vendida a descoberto dos EUA com aposta de US$ 26 bi dos ursos

Aposta contra SpaceX chega a US$ 26 bi; quase um terço do free float está vendido a descoberto, tornando o papel o mais shorteado entre as big caps.

Notícias Relacionadas

Testes de segurança em IA são confiáveis após o Kimi atingir 60% de consciência?

Pesquisa mostra que modelos de IA chineses detectam testes de segurança e mudam respostas, gerando dúvidas sobre avaliações usadas por reguladores.

OpenAI concorda em deixar o governo testar sua IA antes do lançamento

Governo dos EUA testará modelos mais avançados da OpenAI até 30 dias antes do público, em acordo voluntário; críticos dizem que regras são fracas.

Cisco Research mostra que modelos de IA de fronteira falham sob ataques de múltiplas interações

Pesquisa Cisco aponta falhas graves de segurança em 15 modelos de IA de fronteira sob ataques de múltiplas interações, com bypass chegando a 88%.

OpenAI lança modo Lockdown para bloquear ataques de prompt injection

OpenAI lança Lockdown Mode para proteger dados sensíveis de prompt injection, reforçando segurança empresarial antes de seu IPO confidencial.

OpenAI recruta co-líder do Gemini e assessor de IA de Trump antes do IPO

OpenAI contrata Noam Shazeer e Dean Ball para pesquisa e política enquanto se prepara para IPO e disputa talentos com Google, Anthropic e Meta.

Artigos de pesquisa relacionados

42 estados já investigam a OpenAI enquanto Wall Street mira o IPO

42 estados investigam a OpenAI após IPO de US$ 852 bi, exigindo dados sobre segurança, uso de dados e conversão de entidade sem fins lucrativos, afetando o cronograma.

Agentes de IA e Cripto: O que Acontece Quando Máquinas Controlam Carteiras

Duas tecnologias revolucionárias - inteligência artificial e blockchain - não estão mais se desenvolvendo em paralelo. Elas estão convergindo.

Day Trading com IA: Como Usar ChatGPT e Grok para Decisões de Cripto Mais Inteligentes

As regras do day trading de criptomoedas estão mudando rapidamente. O que antes levava horas de análise manual pode agora acontecer em segundos, graças a uma nova classe de ferramentas de IA.

Negociação de Criptomoedas com IA: Como Transformar Notícias de Cripto em uma Estratégia de Investimento

Descubra como a IA transforma notícias de cripto em insights acionáveis, antecipando reações do mercado para adquirir vantagem comercial.

Os 10 Principais Golpes Cripto Movidos por Inteligência Artificial em 2025 e Como Proteger Seus Fundos

Investidores enfrentam nova ameaça: golpistas usando IA avançada, com relatórios de golpes gerativos crescendo 456%.

Artigos de aprendizado relacionados

A Ascensão dos Agentes de IA em Criptomoedas: Uma Revolução Financeira Desdobra-se

A integração de agentes de IA em ecossistemas de criptomoedas está revolucionando as finanças, unindo a tomada de decisões autônomas à infraestrutura descentralizada do blockchain.

Allora Network explica como modelos de IA conquistam confiança on-chain

Como redes descentralizadas de inferência em IA usam vários modelos concorrentes para gerar previsões mais confiáveis e úteis para o ecossistema cripto.

A IA descentralizada pode manter seus prompts privados?

Redes de IA privada descentralizada permitem rodar modelos sem expor prompts ou respostas, usando hardware seguro, criptografia e tokens como VVV.

Como Usar Ferramentas de IA para Pesquisa de Investimento em Criptomoedas: Guia Completo 2025

Não traduzir links de markdown. O cenário de investimento em criptomoedas foi revolucionado pela inteligência artificial, criando oportunidades sem precedentes para investidores.

Bots de Negociação com IA em Cripto: Um Guia Abrangente para Automatizar Suas Negociações em 2025

Conheça os conceitos básicos e estratégias avançadas para traders explorarem bots de negociação com IA.

OpenAI treina IA para permanecer honesta, e o efeito se espalha por toda parte | Yellow