OpenAI test stilletjes Bidi 1 terwijl ChatGPT leert luisteren tijdens het spreken

OpenAI test een niet-aangekondigd bidirectioneel stemmodel genaamd Bidi 1 waarmee ChatGPT tegelijkertijd kan luisteren en spreken.

Belangrijkste punten:

Bidi 1 kan luisteren, spreken en onderbrekingen midden in een zin verwerken zonder het gesprek te laten vastlopen.

Codereferenties doken half juni op, en OpenAI heeft geen officiële aankondiging gedaan.

Het model bereikt inmiddels enkele app-gebruikers, wat wijst op een mogelijke release al deze week.

Bidi 1 duikt op in ChatGPT-code

Code- en interface-elementen die aan het model zijn gekoppeld, doken op in de ChatGPT‑app rond 16 juni, weken vóór enige officiële onthulling door het bedrijf, dat publiekelijk nog niets heeft gezegd. De nieuwe optie staat in de modelkiezer onder instellingen, naast de standaard- en geavanceerde stemmodi die gebruikers al kennen. Als je het selecteert, licht de spraakbel geel op.

De naam is een afkorting voor bidirectioneel ontwerp: een aanpak waarmee de assistent tegelijkertijd kan spreken, horen en luisteren in plaats van beleefd op elke beurt te wachten. Interne code zou het omschrijven als de volgende generatie stem en een grote sprong in intelligentie.

Vroege testers zeggen dat het model al is begonnen uit te rollen naar een subset van gebruikers op web en mobiel, wat wijst op een release al deze week, al kan de uiteindelijke naam nog veranderen.

Ook lezen: Is de Anthropic-perp-verkoop een waarschuwing voor pre-IPO cryptobets?

Bidi 1 gaat goed om met onderbrekingen en geheugen

Het model biedt kleine bevestigingen, zoals een zacht „oké”, wanneer een gebruiker pauzeert of langzamer gaat praten, en doet dat zonder de spreker te onderbreken. Het kan tijdens het gesprek van taak wisselen en bijvoorbeeld direct een telling omkeren zodra een gebruiker ingrijpt. Volgens berichten zijn er selecteerbare intelligentieniveaus met de labels Hoog, Medium en Instant, vergelijkbaar met de keuzes in de tekstmodus, waar gebruikers snellere of juist zorgvuldiger antwoorden kunnen kiezen.

Geheugen zou weleens de grotere verschuiving kunnen zijn, omdat Bidi 1 de draad van een lang gesprek vasthoudt in plaats van eerdere audiocontext te laten vallen, het zwakke punt dat de huidige stemstack van ChatGPT al lang parten speelt. Eén waarneming wees zelfs op realtimevertaling, een functie die nieuwe use‑cases kan ontsluiten zodra het model de ontwikkelaarsinterface bereikt en externe apps aanstuurt.

OpenAI’s stemoffensief versnelt

De upgrade lijkt bedoeld om de kloof te dichten tussen de sterke tekstmodellen van OpenAI en een oudere stemlaag die al maanden achterloopt. Die stemlaag leunde op GPT‑4o, een model dat nooit vanaf de grond is ontworpen voor tweerichtingsaudio. Het bedrijf gokt erop dat spraak, niet typen, voor de meeste mensen de belangrijkste toegangspoort tot AI wordt.

OpenAI heeft de stemfuncties van ChatGPT het afgelopen jaar gestaag verfijnd, en naar verluidt is het model sinds begin 2026 in ontwikkeling, het resultaat van maanden werk in plaats van een overhaaste release. Het lek valt ook samen met de bredere ChatGPT‑herziening rond de Codex‑coderingstool en agentische features die het bedrijf in kaart brengt, al is daarvan nog niets officieel.

Lees hierna: Mane City Mobile komt naar iOS en Android in 100+ landen