ओपनएआई ने प्लस उपयोगकर्ताओं के लिए चैटजीपीटी में उन्नत वॉयस मोड पेश किया
चैटजीपीटी उन्नत वॉयस मोड: यह क्या है
सितंबर 2023 में, OpenAI ने ChatGPT में वॉयस और इमेज क्षमताओं के लिए समर्थन की घोषणा की। इस घोषणा के बाद इस साल मई में एक नया मल्टीमॉडल लैंग्वेज मॉडल आया, जिसे GPT-4o नाम दिया गया, जिसके बारे में कहा गया कि यह ChatGPT में उन्नत वॉयस मोड को सक्षम करेगा।
वॉयस मोड में उन्नत क्षमताओं के बारे में बताते हुए, ओपनएआई ने कहा कि चैटजीपीटी “अधिक प्राकृतिक, वास्तविक समय की बातचीत की पेशकश करेगा, आपको किसी भी समय हस्तक्षेप करने की अनुमति देगा, और आपकी भावनाओं को महसूस करेगा और प्रतिक्रिया देगा।”
वर्तमान संस्करण में, चैटजीपीटी से बात करने के लिए वॉयस मोड औसतन 2.8 सेकंड (जीपीटी-3.5) और 5.4 सेकंड (जीपीटी-4) की विलंबता के साथ काम करता है। यह विलंबता तीन अलग-अलग मॉडलों की डेटा प्रोसेसिंग पाइपलाइन का परिणाम है: एक सरल मॉडल ऑडियो को टेक्स्ट में ट्रांसक्राइब करता है, जीपीटी-3.5 या जीपीटी-4 टेक्स्ट लेता है और टेक्स्ट आउटपुट करता है, और तीसरा सरल मॉडल उस टेक्स्ट को वापस ऑडियो में बदल देता है। ओपनएआई के अनुसार, इस प्रक्रिया के परिणामस्वरूप खुफिया जानकारी के मुख्य स्रोत, जीपीटी-4 को बहुत सारी जानकारी का नुकसान होता है।
GPT-4o मॉडल के साथ, जिसके बारे में कंपनी ने कहा कि इसे टेक्स्ट, विज़न और ऑडियो में एंड-टू-एंड प्रशिक्षित किया गया है, सभी इनपुट और आउटपुट एक ही न्यूरल नेटवर्क द्वारा संसाधित किए जाते हैं। यह प्राकृतिक संवादात्मक अनुभव के लिए विलंबता को कम करता है और परिणामों को बेहतर बनाता है क्योंकि सभी जानकारी एक ही न्यूरल नेटवर्क पर संसाधित होती है। इसके अतिरिक्त, OpenAI ने कहा कि GPT-4o रुकावटों को संभालने में अधिक सक्षम है, समूह वार्तालापों को प्रभावी ढंग से प्रबंधित करता है, पृष्ठभूमि शोर को फ़िल्टर करता है, और टोन के अनुकूल होता है।
अनिवार्यतः, उन्नत वॉयस मोड चैटजीपीटी में संवादात्मक कृत्रिम बुद्धिमत्ता को सक्षम बनाता है।
चैटजीपीटी उन्नत वॉयस मोड: उपलब्धता
उन्नत वॉयस मोड क्षमता का परीक्षण वर्तमान में चैटजीपीटी प्लस उपयोगकर्ताओं के एक छोटे समूह के साथ किया जा रहा है। ओपनएआई ने कहा कि इस अल्फा में चुने गए उपयोगकर्ताओं को उनके मोबाइल ऐप में निर्देशों और संदेश के साथ एक ईमेल प्राप्त होगा। ओपनएआई रोलिंग आधार पर और अधिक लोगों को जोड़ने की योजना बना रहा है और प्लस पर सभी को शरद ऋतु में पहुंच प्रदान करने की योजना बना रहा है।
ओपनएआई ने कहा कि इस अल्फा से सीखने से उसे उन्नत वॉयस एक्सपीरियंस को सभी के लिए सुरक्षित और अधिक मनोरंजक बनाने में मदद मिलेगी। स्टार्टअप अगस्त की शुरुआत में GPT-4o की क्षमताओं, सीमाओं और सुरक्षा मूल्यांकन पर एक विस्तृत रिपोर्ट साझा करने की योजना बना रहा है।