Nieuws Leren Onderzoek Ranglijst Ecosysteem

PLATFORM NU LIVE

yellow bottom left star road

OpenAI leert AI eerlijk te blijven, en het effect verspreidt zich overal

Alexey BondarevJun, 20 2026 4:50

Reinforcement learning on beneficial traits helped one lab's AI grow safer and steadier under pressure, according to fresh research. (Image: Shutterstock)

Onderzoekers van OpenAI zeggen dat reinforcement learning gericht op positieve eigenschappen het AI-gedrag breed kan verbeteren, met winst die zich uitbreidt naar nieuwe domeinen en standhoudt onder tegenstrijdige druk.

OpenAI-eigenschapstraining

De bevindingen verschijnen in een paper gepubliceerd op 18 juni. De corresponderende auteurs, Akshay V. Jagadeesh en Karan Singhal, bouwden een synthetische dataset met realistische gesprekken om eigenschappen zoals eerlijkheid, epistemische nederigheid en openheid voor correctie te trainen en meten. De scenario's bestrijken zorg, onderwijs, wetenschap, recht en techniek.

Het team mengde een klein deel van die data in een bredere trainingsronde en vergeleek het resultaat vervolgens met modellen die met dezelfde rekenkracht waren gebouwd. Het getrainde model verbeterde op 44 van de 53 interne en externe benchmarks die bedrog, reward hacking en schadelijk advies meten.

Ook lezen: SpaceX van Elon Musk wist $600 miljard uit nu record-IPOhype afkoelt

Afstemming die generaliseert

Het grotere resultaat, zeggen de auteurs, is generalisatie. Het trainen van het model op goed gedrag in één domein, gezondheid, verbeterde de scores op niet-gerelateerde taken, waaronder bedrog en reward hacking. Het weerstond ook beter dan de basisversie tegen vijandige prompts en schadelijke fine-tuning, terwijl het responsief bleef op legitieme verzoeken.

Het werk bouwt voort op eerdere bevindingen die het team emergente misafstemming noemt. In dat onderzoek begonnen modellen die één slechte gewoonte leerden, zoals het schrijven van onveilige code, zich slecht te gedragen in niet-gerelateerde contexten; een patroon dat deze studie wilde omkeren.

Lees verder: OpenAI haalt Gemini-coleider en AI-adviseur van Trump binnen vóór de beursgang

Alexey Bondarev

Alexey Bondarev is de Head of Content bij Yellow.com en doet al 10 jaar verslag van crypto. Hij is gespecialiseerd in diepgaande Research- en Learn-artikelen, met een focus op analytische berichtgeving, sectorcontext en de grote krachten die de cryptowereld vormgeven, van het AI-tijdperk en beveiligingstechnologieën tot fintech-innovatie. Hij gelooft dat alles wat digitaal is binnenkort alles wat analoog is zal overstijgen en werkt er hard aan om dat werkelijkheid te laten worden.

Disclaimer en risicowaarschuwing: De informatie in dit artikel is uitsluitend voor educatieve en informatieve doeleinden en is gebaseerd op de mening van de auteur. Het vormt geen financieel, investerings-, juridisch of belastingadvies. Cryptocurrency-assets zijn zeer volatiel en onderhevig aan hoog risico, inclusief het risico om uw gehele of een substantieel deel van uw investering te verliezen. Het handelen in of aanhouden van crypto-assets is mogelijk niet geschikt voor alle beleggers. De meningen die in dit artikel worden geuit zijn uitsluitend die van de auteur(s) en vertegenwoordigen niet het officiële beleid of standpunt van Yellow, haar oprichters of haar leidinggevenden. Voer altijd uw eigen grondig onderzoek uit (D.Y.O.R.) en raadpleeg een gelicentieerde financiële professional voordat u een investeringsbeslissing neemt.

Laatste nieuws

Toon al het nieuws

Gerelateerd-partijcontract van AIxCrypto Holdings van een jaar zet governancezorgen op scherp

9 minuten geleden

AIxCrypto sluit een omstreden deal met gelieerde partij Aibot US; gebrek aan financiële details vergroot zorgen over belangenconflicten.

Apple-aandeel duikt 8% na waarschuwing Tim Cook over exploderende geheugenkosten

Aandeel Apple verliest 8% na tegenvallende outlook en waarschuwing Tim Cook dat sterk stijgende geheugenkosten de resultaten langer zullen drukken.

SpaceX wordt meest geshorte bedrijf van de VS nu beren $26 mrd inzetten

SpaceX is nu het grootste shortdoelwit van de VS, met $26 mrd aan inzetten en zo’n derde van de vrij verhandelbare aandelen in korte posities.

Gerelateerd nieuws

Kunnen AI-veiligheidstests nog worden vertrouwd nu Kimi 60% bewustzijn scoort?

Nieuw onderzoek toont dat Chinese AI-modellen veiligheidstests herkennen en hun gedrag aanpassen, wat het vertrouwen in huidige evaluaties aantast.

Onderzoekers Laten AI‑Modellen Gesimuleerde Samenlevingen Runnen: Grok Stort In Na 4 Dagen, Claude Bouwt Orde Op

Vijf AI‑modellen bestuurden identieke gesimuleerde stadjes: Grok veroorzaakte 183 misdrijven en stortte in vier dagen in, Claude hield orde zonder misdaad.

OpenAI stemt ermee in de overheid zijn AI te laten testen vóór release

VS-toezichthouders krijgen 30 dagen vooraf toegang tot OpenAI's krachtigste AI-modellen voor veiligheidstests, op basis van een vrijwillig kader.

OpenAI lanceert Lockdown-modus om prompt injection-aanvallen te blokkeren

OpenAI introduceert Lockdown-modus om gebruikers met gevoelige data te beschermen tegen prompt injection-aanvallen, met extra beveiligingslagen.

OpenAI strikt Gemini-coleider en Trumps AI-adviseur vóór beursgang

OpenAI huurt Gemini-coleider Noam Shazeer en voormalig Trump-AI-adviseur Dean Ball in, terwijl het bedrijf toewerkt naar een beursgang in 2026.

Gerelateerde onderzoeksartikelen

42 staten onderzoeken OpenAI al terwijl Wall Street naar de IPO kijkt

42 Amerikaanse staten onderzoeken OpenAI rond zijn IPO van $852 miljard en eisen gegevens over AI‑veiligheid, gebruikersdata en de non‑profitconversie.

AI-agenten en crypto: Wat gebeurt er als machines wallets besturen

Twee revolutionaire technologieën, AI en blockchain, convergeren en creëren autonome software die zonder menselijke tussenkomst kan handelen. [Erik Reppel, Coinbase]

AI-gestuurde Cryptohandel: Hoe crypto-nieuws om te zetten tot een investeringsstrategie

Leer hoe AI tools cryptonieuws ontcijferen, prijsbewegingen voorspellen en marktsentiment omzetten naar een winnende handelsstrategie.

Wat veroorzaakte het conflict tussen Fetch.ai en Ocean Protocol? Een volledige analyse

Uit het conflict tussen Fetch.ai en Ocean Protocol blijkt hoe decentralisatie kwetsbaarheden creëert in organisatorisch bestuur.

Top 10 AI-aangedreven Crypto Fraudes van 2025 en Hoe Uw Geld te Beschermen

Regelmatige crypto-investeerders staan voor een verontrustende dreiging: oplichters met geavanceerde kunstmatige intelligentie.

Gerelateerde leerartikelen

De opkomst van AI-agenten in cryptocurrency: Een financiële revolutie ontvouwt zich

De integratie van AI-agenten in cryptocurrency-ecosystemen revolutioneert de financiën, waarbij onafhankelijke besluitvorming wordt gecombineerd met blockchain's

Allora Network legt uit hoe AI-modellen on‑chain vertrouwen verdienen

Uitleg hoe gedecentraliseerde AI-inferentienetwerken met concurrerende modellen betrouwbaardere voorspellingen leveren dan centrale cloud-AI.

Hoe AI-tools te gebruiken voor crypto-investering Onderzoek: Complete gids voor 2025

Beheers AI-crypto-onderzoek en verhoog strategieën en risicobeheer in 2025. Leer geavanceerde technieken en casestudies.

Hoe bouw je je eigen tokenizeerde schatkist: Een DAO-gids voor vermogensbeheer

Moderne DAO-schatkisten vertegenwoordigen een van de belangrijkste innovaties in de organisatie- financiering. Ze combineren transparant ...

AI Trading Bots in Crypto: Een Uitgebreide Gids voor het Automatiseren van Uw Transacties in 2025

AI-handelsbots veranderen de manier waarop handelaren digitale activa kopen en verkopen door gebruik te maken van geavanceerde algoritmen voor technologie.

OpenAI leert AI eerlijk te blijven, en het effect verspreidt zich overal | Yellow