Google का जेमिनी: क्या नया AI मॉडल वास्तव में ChatGPT से बेहतर है?
Google का मिथुन राशि एक प्रमुख प्रतियोगी के उभरने का संकेत देता है। बेशक, OpenAI लगभग निश्चित रूप से GPT-5 पर काम कर रहा है, और हम उम्मीद कर सकते हैं कि यह मल्टीमॉडल भी होगा।
Google Deepmind ने हाल ही में OpenAI के ChatGPT को टक्कर देने के लिए अपने नए AI मॉडल जेमिनी की घोषणा की है। जबकि दोनों मॉडल "जेनरेटिव एआई" के उदाहरण हैं, जो इनपुट प्रशिक्षण जानकारी के पैटर्न ढूंढना सीखते हैं।
जिस तरह चैटजीपीटी बातचीत के लिए एक वेब ऐप है जो जीपीटी नामक तंत्रिका नेटवर्क पर आधारित है (बड़ी मात्रा में टेक्स्ट पर प्रशिक्षित), Google के पास बार्ड नामक एक संवादात्मक वेब ऐप है ।
जो बात जेमिनी को पहले के जेनेरिक एआई मॉडल जैसे कि लाएमडीए से अलग करती है, वह यह है कि यह एक "मल्टी-मॉडल मॉडल" है। इसका मतलब यह है कि यह इनपुट और आउटपुट के कई तरीकों के साथ सीधे काम करता है: साथ ही सप भी सितंबर में, OpenAI ने GPT-4Vision नामक एक मॉडल की घोषणा की जो छवियों, ऑडियो और टेक्स्ट के साथ भी काम कर सकता है। हालाँकि, यह उस तरह से पूरी तरह से मल्टीमॉडल मॉडल नहीं है जैसा जेमिनी होने का वादा करता है।
इसी तरह, ChatGPT-4 छवियों का उत्पादन कर सकता है, लेकिन यह पाठ संकेतों को उत्पन्न करके ऐसा करता है जो Dall-E 2 नामक एक अलग गहन शिक्षण मॉडल में पारित हो जाते हैं, जो पाठ विवरणों को छवियों में परिवर्तित करता है।
इसके विपरीत, Google ने जेमिनी को "मूल रूप से मल्टीमॉडल" के रूप में डिज़ाइन किया है। इसका मतलब यह है कि कोर मॉडल सीधे इनपुट प्रकारों (ऑडियो, चित्र, वीडियो और टेक्स्ट) की एक श्रृंखला को संभालता है और उन्हें सीधे आउटपुट भी कर सकता है
निर्णय
इन दोनों दृष्टिकोणों के बीच अंतर अकादमिक लग सकता है, लेकिन यह महत्वपूर्ण है। Google की तकनीकी रिपोर्ट और आज तक के अन्य गुणात्मक परीक्षणों से सामान्य निष्कर्ष यह है।
Google ने जेमिनी के एक अधिक शक्तिशाली संस्करण की भी घोषणा की, जिसे जेमिनी 1.0 अल्ट्रा कहा जाता है, और कुछ परिणाम प्रस्तुत किए हैं जो दर्शाते हैं कि यह GPT-4 से अधिक शक्तिशाली है। हालाँकि, इसका आकलन करना कठिन है।