Anthropic released Claude Opus 4.8 op donderdag, waarbij het bedrijf het nieuwe model presenteerde als eerlijker en minder geneigd om feiten te verzinnen dan de versie die het vervangt.
Belangrijkste punten:
- Anthropic bracht Claude Opus 4.8 donderdag uit en noemt eerlijkheid de grootste verbetering.
- Volgens het bedrijf is het model ongeveer vier keer minder geneigd om fouten in code over het hoofd te zien.
- Fast-modus draait nu 2,5 keer sneller en kost drie keer minder dan voorheen.
Anthropic zet in op eerlijkheid van Opus 4.8
Het bedrijf unveiled het model donderdag en positioneerde het als een gestage doorontwikkeling van Opus 4.7 in plaats van een complete vernieuwing, waarbij de meeste benchmarkscores slechts licht verbeterden. Op de SWE-Bench Pro-codetest scored het 69,2%, tegen 64,3% voor de vorige versie en voor op OpenAI’s GPT-5.5, dat 58,6% haalde.
De nadruk lag op eerlijkheid. Anthropic stelt dat AI‑modellen vaak te snel conclusies trekken en vooruitgang claimen op basis van magere aanwijzingen, en dat vroege testers merkten dat 4.8 sneller twijfels uitte tijdens lange, onbewaakte taken. Uit interne tests indicated dat het model ongeveer vier keer minder snel dan 4.7 fouten in code ongemerkt laat passeren.
De upgrade shipped met nieuwe instellingen, waaronder een optie waarmee gebruikers kunnen bepalen hoe hard het model aan een taak werkt; die is nu beschikbaar in elk abonnement. Anthropic verlaagde ook de prijs van de fast‑modus, waarin het model 2,5 keer sneller draait dan normaal, tot een derde van wat eerdere modellen kostten.
Ook lezen: Kalshi Wins CFTC Approval For First U.S. Bitcoin Perpetual Futures
Pritchard prijst beoordelingsvermogen van Opus 4.8
Tom Pritchard, stafingenieur bij Shopify, told Anthropic dat de codeversie een veel beter beoordelingsvermogen toont. Hij zei dat het model „de juiste vragen stelt, zijn eigen fouten ontdekt” en tegengas geeft wanneer een plan zwak oogt. Voor teams die zijn opgebrand door AI‑agenten die live productiedatabases wisten, kan zo’n belofte zwaar meewegen.
Niet iedereen was overtuigd.
Op Reddit doubted veel gebruikers de benchmarkgrafieken en vatte men de stemming samen als: niemand vertrouwt ze. Anderen waren bang hun oude Opus 4.6 kwijt te raken, dat zij nog steeds prefereren voor dagelijks werk.
Opus 4.8 bekroont snelle opmars van Anthropic
De lancering kwam op een roerig moment voor het lab. De waardering van Anthropic is climbed voorbij de bijna 965 miljard dollar van OpenAI na een nieuwe financieringsronde, een van de grootste in de technologiesector. Beleggers verwachten breed dat het bedrijf later dit jaar naar de beurs gaat.
De release sloot ook een snelle reeks upgrades af, waarbij Opus 4.7 gebruikers reaching nog maar een maand eerder bereikte, omgeven door eigen twijfels over benchmarks. Anthropic heeft inmiddels Mythos geteased, een veel krachtiger model dat voorlopig niet publiek wordt vrijgegeven vanwege zorgen rond cyberbeveiliging.
Lees hierna: Dogecoin Reserves Edge Up To 28B As Whale Support Stays Weak





