Anthropic zegt dat nieuwe Claude Opus 4.8 vier keer meer van zijn fouten opvangt

Anthropic zegt dat nieuwe Claude Opus 4.8 vier keer meer van zijn fouten opvangt

Anthropic released Claude Opus 4.8 op donderdag, waarbij het bedrijf het nieuwe model presenteerde als eerlijker en minder geneigd om feiten te verzinnen dan de versie die het vervangt.

Belangrijkste punten:

  • Anthropic bracht Claude Opus 4.8 donderdag uit en noemt eerlijkheid de grootste verbetering.
  • Volgens het bedrijf is het model ongeveer vier keer minder geneigd om fouten in code over het hoofd te zien.
  • Fast-modus draait nu 2,5 keer sneller en kost drie keer minder dan voorheen.

Anthropic zet in op eerlijkheid van Opus 4.8

Het bedrijf unveiled het model donderdag en positioneerde het als een gestage doorontwikkeling van Opus 4.7 in plaats van een complete vernieuwing, waarbij de meeste benchmark­scores slechts licht verbeterden. Op de SWE-Bench Pro-codetest scored het 69,2%, tegen 64,3% voor de vorige versie en voor op OpenAI’s GPT-5.5, dat 58,6% haalde.

De nadruk lag op eerlijkheid. Anthropic stelt dat AI‑modellen vaak te snel conclusies trekken en vooruitgang claimen op basis van magere aanwijzingen, en dat vroege testers merkten dat 4.8 sneller twijfels uitte tijdens lange, onbewaakte taken. Uit interne tests indicated dat het model ongeveer vier keer minder snel dan 4.7 fouten in code ongemerkt laat passeren.

De upgrade shipped met nieuwe instellingen, waaronder een optie waarmee gebruikers kunnen bepalen hoe hard het model aan een taak werkt; die is nu beschikbaar in elk abonnement. Anthropic verlaagde ook de prijs van de fast‑modus, waarin het model 2,5 keer sneller draait dan normaal, tot een derde van wat eerdere modellen kostten.

Ook lezen: Kalshi Wins CFTC Approval For First U.S. Bitcoin Perpetual Futures

Pritchard prijst beoordelingsvermogen van Opus 4.8

Tom Pritchard, stafingenieur bij Shopify, told Anthropic dat de codeversie een veel beter beoordelingsvermogen toont. Hij zei dat het model „de juiste vragen stelt, zijn eigen fouten ontdekt” en tegengas geeft wanneer een plan zwak oogt. Voor teams die zijn opgebrand door AI‑agenten die live productie­databases wisten, kan zo’n belofte zwaar meewegen.

Niet iedereen was overtuigd.

Op Reddit doubted veel gebruikers de benchmarkgrafieken en vatte men de stemming samen als: niemand vertrouwt ze. Anderen waren bang hun oude Opus 4.6 kwijt te raken, dat zij nog steeds prefereren voor dagelijks werk.

Opus 4.8 bekroont snelle opmars van Anthropic

De lancering kwam op een roerig moment voor het lab. De waardering van Anthropic is climbed voorbij de bijna 965 miljard dollar van OpenAI na een nieuwe financieringsronde, een van de grootste in de technologiesector. Beleggers verwachten breed dat het bedrijf later dit jaar naar de beurs gaat.

De release sloot ook een snelle reeks upgrades af, waarbij Opus 4.7 gebruikers reaching nog maar een maand eerder bereikte, omgeven door eigen twijfels over benchmarks. Anthropic heeft inmiddels Mythos geteased, een veel krachtiger model dat voorlopig niet publiek wordt vrijgegeven vanwege zorgen rond cyberbeveiliging.

Lees hierna: Dogecoin Reserves Edge Up To 28B As Whale Support Stays Weak

Disclaimer en risicowaarschuwing: De informatie in dit artikel is uitsluitend voor educatieve en informatieve doeleinden en is gebaseerd op de mening van de auteur. Het vormt geen financieel, investerings-, juridisch of belastingadvies. Cryptocurrency-assets zijn zeer volatiel en onderhevig aan hoog risico, inclusief het risico om uw gehele of een substantieel deel van uw investering te verliezen. Het handelen in of aanhouden van crypto-assets is mogelijk niet geschikt voor alle beleggers. De meningen die in dit artikel worden geuit zijn uitsluitend die van de auteur(s) en vertegenwoordigen niet het officiële beleid of standpunt van Yellow, haar oprichters of haar leidinggevenden. Voer altijd uw eigen grondig onderzoek uit (D.Y.O.R.) en raadpleeg een gelicentieerde financiële professional voordat u een investeringsbeslissing neemt.
Laatste nieuws
Toon al het nieuws
Anthropic zegt dat nieuwe Claude Opus 4.8 vier keer meer van zijn fouten opvangt | Yellow.com