Ya, "ChatGPT kini bisa melihat, mendengar, dan bicara," kata OpenAI mengutip pengumuman resmi peluncuran kemampuan baru ChatGPT di laman resminya, Selasa.
OpenAI meluncurkan kemampuan suara dan gambar baru di ChatGPT, yang menawarkan jenis antarmuka baru yang lebih intuitif dengan memungkinkan penggunanya melakukan percakapan suara atau memberitahu ChatGPT tentang apa yang anda bicarakan.
Suara dan gambar memberi pengguna lebih banyak cara untuk menggunakan ChatGPT dalam kehidupan sehari-hari. Pengguna, misal, bisa memotret isi kulkas dan dapur kemudian mencari tahu menu apa untuk makan malam hari ini.
Setelah makan malam, anda juga bisa membantu anak mengerjakan soal matematika dengan mengambil foto, melingkari kumpulan soal, dan minta ChatGPT berbagi petunjuk mengenai menemukan jawabannya.
Anda kini dapat menggunakan suara untuk melakukan percakapan bolak-balik dengan ChatGPT. Bicaralah dengannya saat bepergian, minta cerita pengantar tidur untuk keluarga, atau selesaikan perdebatan di meja makan.
Untuk memulai interaksi dengan suara, buka Pengaturan kemudian pilih Fitur Baru di aplikasi seluler dan ikut serta dalam percakapan suara. Kemudian, ketuk tombol headphone yang terletak di sudut kanan atas layar dan pilih suara pilihan anda dari lima suara berbeda.
ChatGPT can now see, hear, and speak. Rolling out over next two weeks, Plus users will be able to have voice conversations with ChatGPT (iOS & Android) and to include images in conversations (all platforms). https://t.co/uNZjgbR5Bm pic.twitter.com/paG0hMshXb
— OpenAI (@OpenAI) September 25, 2023
Kemampuan suara baru ini didukung oleh model text-to-speech baru, yang mampu menghasilkan audio mirip manusia hanya dari teks dan contoh ucapan beberapa detik.
OpenAI berkolaborasi dengan pengisi suara profesional untuk menciptakan setiap suara. "Kami juga menggunakan Whisper, sistem pengenalan ucapan sumber terbuka kami, untuk menyalin kata-kata yang Anda ucapkan ke dalam teks," kata OpenAI.