OpenAI sedang menguji model suara dua arah yang belum diumumkan bernama Bidi 1 yang memungkinkan ChatGPT mendengar dan berbicara secara bersamaan.
Poin Utama:
- Bidi 1 dapat mendengar, berbicara, dan menyerap interupsi di tengah kalimat tanpa membuat percakapan macet.
- Referensi kode muncul pada pertengahan Juni, dan OpenAI belum membuat pengumuman resmi.
- Model ini sudah mulai menjangkau sebagian pengguna aplikasi, mengisyaratkan rilis secepatnya pekan ini.
Bidi 1 Muncul di Kode ChatGPT
Kode dan elemen antarmuka yang terkait dengan model ini pertama kali muncul di dalam aplikasi ChatGPT sekitar 16 Juni, beberapa minggu sebelum pengungkapan resmi dari perusahaan yang belum mengatakan apa pun secara publik. Opsi baru ini berada di pemilih model di bawah pengaturan, di samping mode suara standar dan lanjutan yang sudah dikenal pengguna. Saat dipilih, gelembung suara akan menyala kuning.
Namanya adalah singkatan dari desain bidirectional, sebuah pendekatan yang memungkinkan asisten berbicara, mendengar, dan menyimak sekaligus alih-alih menunggu dengan sopan setiap giliran. Kode internal dilaporkan membingkainya sebagai generasi berikutnya dari suara dan lompatan besar dalam kecerdasan.
Penguji awal mengatakan model ini sudah mulai menjangkau sebagian pengguna di web dan mobile, yang menandakan rilis secepatnya pekan ini, meski nama akhirnya masih bisa berubah.
Juga Baca: Apakah Penjualan Anthropic Perp Menjadi Peringatan untuk Taruhan Kripto Pra-IPO?
Bidi 1 Menangani Interupsi dan Memori
Model ini menawarkan pengakuan kecil, seperti kata pelan "oke", ketika pengguna berhenti atau melambat, dan ia mengelolanya tanpa memotong pembicara. Ia dapat mengganti tugas secara langsung, membalik hitungan seketika saat pengguna menyela. Laporan menggambarkan tingkatan kecerdasan yang dapat dipilih berlabel High, Medium, dan Instant, mencerminkan pilihan yang sudah ditawarkan pada sisi teks, di mana pengguna memilih jawaban yang lebih cepat atau lebih hati-hati.
Memori bisa menjadi perubahan yang lebih besar, karena Bidi 1 mempertahankan benang percakapan panjang alih-alih menjatuhkan konteks audio sebelumnya, titik lemah yang lama membayangi tumpukan suara ChatGPT saat ini. Satu laporan bahkan menunjuk pada penerjemahan waktu nyata, fitur yang dapat membuka kasus penggunaan baru setelah model ini mencapai antarmuka pengembang dan menggerakkan aplikasi eksternal.
Dorongan Suara OpenAI Makin Cepat
Peningkatan ini tampak sebagai upaya menutup kesenjangan antara model teks kuat milik OpenAI dan lapisan suara yang lebih lama yang tertinggal selama berbulan-bulan. Lapisan itu bertumpu pada GPT-4o, model yang tidak pernah dibangun dari nol untuk audio dua arah. Perusahaan bertaruh bahwa ucapan, bukan mengetik, akan menjadi jalur utama ke AI bagi kebanyakan orang.
OpenAI telah menyempurnakan fitur suara ChatGPT secara bertahap selama setahun terakhir, dan model ini dilaporkan telah dikembangkan sejak awal 2026, hasil dari kerja berbulan-bulan alih-alih rilis yang tergesa-gesa. Bocoran ini juga muncul saat perusahaan memetakan perombakan ChatGPT yang lebih luas di sekitar alat pemrograman Codex dan fitur agentic, meski belum ada yang resmi.
Baca Selanjutnya: Mane City Mobile Hadir di iOS dan Android di 100+ Negara





