OpenAI teste discrètement Bidi 1 alors que ChatGPT apprend à écouter tout en parlant

OpenAI teste discrètement Bidi 1 alors que ChatGPT apprend à écouter tout en parlant

OpenAI teste un modèle vocal bidirectionnel non annoncé appelé Bidi 1, qui permet à ChatGPT d’écouter et de parler en même temps.

Points clés :

  • Bidi 1 peut écouter, parler et gérer des interruptions en plein milieu de phrase sans figer la conversation.
  • Des références dans le code sont apparues à la mi‑juin et OpenAI n’a fait aucune annonce officielle.
  • Le modèle commence à être proposé à certains utilisateurs de l’application, ce qui laisse présager un lancement dès cette semaine.

Bidi 1 apparaît dans le code de ChatGPT

Du code et des éléments d’interface liés au modèle sont d’abord apparus dans l’application ChatGPT autour du 16 juin, des semaines avant toute révélation officielle de la part d’une entreprise qui n’a encore rien dit publiquement. La nouvelle option se trouve dans le sélecteur de modèles, dans les paramètres, à côté des modes vocaux standard et avancé déjà connus des utilisateurs. Une fois sélectionnée, la bulle vocale devient jaune.

Le nom est une forme abrégée de « bidirectionnel », une approche qui permet à l’assistant de parler, entendre et écouter en même temps, plutôt que d’attendre poliment chaque tour de parole. Le code interne le présente apparemment comme la nouvelle génération de la voix et un bond majeur en matière d’intelligence.

Les premiers testeurs indiquent que le modèle a déjà commencé à atteindre un sous‑ensemble d’utilisateurs sur le web et le mobile, ce qui laisse penser à une sortie dès cette semaine, même si le nom final pourrait encore changer.

À lire aussi : La vente massive de perpétuels Anthropic est‑elle un avertissement pour les paris crypto pré‑IPO ?

Bidi 1 gère les interruptions et la mémoire

Le modèle propose de petits acquiescements, comme un discret « d’accord », lorsque l’utilisateur fait une pause ou ralentit, et il y parvient sans le couper. Il peut changer de tâche à la volée, par exemple inverser un compte à rebours dès que l’utilisateur l’interrompt. Des rapports évoquent des niveaux d’intelligence sélectionnables, étiquetés Élevé, Moyen et Instantané, qui reflètent les choix déjà proposés côté texte, où les utilisateurs privilégient des réponses plus rapides ou plus prudentes.

La mémoire pourrait être le changement le plus significatif, car Bidi 1 conserve le fil d’une longue conversation au lieu d’abandonner le contexte audio précédent — un point faible qui handicape depuis longtemps la pile vocale actuelle de ChatGPT. Un signalement évoque même une traduction en temps réel, une fonctionnalité qui pourrait ouvrir de nouveaux cas d’usage une fois que le modèle sera disponible via l’interface développeur et qu’il alimentera des applications tierces.

L’offensive vocale d’OpenAI s’accélère

Cette mise à niveau ressemble à une tentative de combler l’écart entre les puissants modèles texte d’OpenAI et une couche vocale plus ancienne, en retard depuis des mois. Cette couche s’appuyait sur GPT‑4o, un modèle qui n’a jamais été conçu, à la base, pour un dialogue audio bidirectionnel. L’entreprise parie que la voix, plutôt que la saisie au clavier, deviendra la principale porte d’entrée vers l’IA pour la plupart des gens.

OpenAI a affiné les fonctions vocales de ChatGPT de façon continue au cours de l’année écoulée, et le modèle serait en développement depuis le début de 2026, fruit de mois de travail plutôt que d’une sortie précipitée. La fuite tombe également au moment où l’entreprise prépare une refonte plus large de ChatGPT autour de son outil de programmation Codex et de capacités agentiques, même si rien de tout cela n’a encore été officialisé.

À lire ensuite : Mane City Mobile arrive sur iOS et Android dans plus de 100 pays

Avertissement et avertissement sur les risques : Les informations fournies dans cet article sont à des fins éducatives et informatives uniquement et sont basées sur l'opinion de l'auteur. Elles ne constituent pas des conseils financiers, d'investissement, juridiques ou fiscaux. Les actifs de cryptomonnaie sont très volatils et sujets à des risques élevés, y compris le risque de perdre tout ou une partie substantielle de votre investissement. Le trading ou la détention d'actifs crypto peut ne pas convenir à tous les investisseurs. Les opinions exprimées dans cet article sont uniquement celles de l'auteur/des auteurs et ne représentent pas la politique officielle ou la position de Yellow, de ses fondateurs ou de ses dirigeants. Effectuez toujours vos propres recherches approfondies (D.Y.O.R.) et consultez un professionnel financier agréé avant de prendre toute décision d'investissement.
Dernières nouvelles
Voir toutes les nouvelles
OpenAI teste discrètement Bidi 1 alors que ChatGPT apprend à écouter tout en parlant | Yellow.com