जब से अल्फाबेट ने अपनी एआई इकाइयों, डीपमाइंड और गूगल ब्रेन का विलय किया है, कंपनी के भीतर डीपमाइंड ने एक अलग गति पकड़ी है। इस बदलाव ने अब हाइपर-प्रतिस्पर्धी आर्टिफिशियल इंटेलिजेंस बाजार में तकनीकी दिग्गज के लिए बदलाव की दिशा तय की है। हिन्दू, शेषु अज्जरापुगूगल डीपमाइंड में इंजीनियरिंग और उत्पाद के वरिष्ठ निदेशक, और मनीष गुप्तागूगल डीपमाइंड (भारत) के निदेशक ने बताया कि विलय के बाद से उनके लिए क्या उपयोगी रहा है, जेनएआई के प्रचार के पीछे की सच्चाई क्या है, तथा शोध के लिए व्यावसायीकरण क्यों महत्वपूर्ण है।
नीचे संपादित अंश:
टीएचजी: गूगल ब्रेन और डीपमाइंड के बीच विलय के बाद से परिवर्तन कैसा रहा है?
शेषु अज्जरापु: जनादेश हमेशा उन्हें (Google की आंतरिक टीमों और DeepMind) अलग रखने का था। हमें एक टीम की ज़रूरत थी जो दीर्घावधि में सोच सके और उत्पादों को वितरित करने के दैनिक दबाव के बिना उन्नत बुद्धिमत्ता और कृत्रिम सामान्य बुद्धिमत्ता (AGI) के लिए समाधान कर सके। यह कुछ समय के लिए ठीक रहा। लेकिन अंततः यह मान्यता बन गई कि बुद्धिमत्ता को हल करने के कई तरीके हैं। एक न्यूरल नेट के माध्यम से था जो ट्रांसफॉर्मर्स पेपर प्रकाशित करने के बाद एक अलग रास्ता बन गया। फिर, एक और रास्ता था जिसे हम ‘संज्ञानात्मक एजेंट’ कहते थे, जहाँ एजेंट सीख रहे थे कि नकली वातावरण में कैसे व्यवहार करना है। किसी बिंदु पर, ये सभी रास्ते एक साथ आने लगे और हमें एहसास हुआ कि हमें एक ही काम करने वाली कई टीमों की ज़रूरत नहीं है। अप्रैल में विलय के छह महीने के भीतर, हमने जेमिनी मॉडल वितरित किए। उसके तुरंत बाद [launch]हमने बहुत जल्दी जेमिनी 1.5 प्रो को लंबे कॉन्टेक्स्ट विंडो और मिक्सचर ऑफ एक्सपर्ट्स (MoE) आर्किटेक्चर के साथ लॉन्च किया। फिर, हमने जेमिनी फ्लैश और मिनी लॉन्च किया।
टीएचजी: क्या आप इस बात से चिंतित हैं कि वाणिज्यिक उत्पाद बनाने पर ध्यान केन्द्रित होने के कारण अनुसंधान पीछे छूट सकता है?
सेषुशोध की संभावनाओं को दिखाने का एकमात्र तरीका यह है कि पहले पेटेंट के लिए आवेदन किया जाए, शोध को प्रकाशित किया जाए और फिर उत्पाद लॉन्च किया जाए, है न? मुझे यकीन है कि जब आप 184,000 से अधिक कर्मचारियों वाली कंपनी पर विचार करते हैं, तो हमेशा कोई न कोई ऐसा व्यक्ति होगा जो सहमत नहीं होगा, लेकिन मुझे लगता है कि इसका कुल प्रभाव यह है कि लोग आखिरकार योगदान देने में खुश हैं।
THG: गूगल डीपमाइंड के सीईओ डेमिस हसबिस ने हाल ही में एक टिप्पणी की थी, जिसमें उन्होंने जेनरेटिव एआई को लेकर बहुत ज़्यादा प्रचार-प्रसार और एआई में शोध के अन्य क्षेत्रों के पीछे छूट जाने के जोखिम के बारे में बताया था। क्या यह सच है?
शेषु: शायद यह स्टार्टअप इकोसिस्टम के लिए सही है, लेकिन हमारे साथ ऐसा नहीं है क्योंकि हमारे पास गैर-जनरल एआई शोध पर काम करने वाले लोगों की एक महत्वपूर्ण संख्या है। हमारे पास उत्पादों का अधिक संतुलित पोर्टफोलियो है। मुझे लगता है कि उपयोग के कुछ खास मामले हैं जहाँ GenAI के पास देने के लिए बहुत कुछ है। उनमें से एक कोपायलट जैसा एप्लिकेशन हो सकता है। दूसरा क्रिएटिविटी हो सकता है, और तीसरा साथी हो सकता है। और ये सभी उपयोग के मामले बहुत ही आकर्षक हैं। लेकिन हम भ्रम, तथ्यात्मकता आदि जैसे मुद्दों से जूझते हैं। इसलिए, इन क्षेत्रों में काम किया जाना बाकी है। कुछ समस्याओं के लिए, मुझे वास्तव में नहीं लगता कि यह बिल्कुल भी प्रचार है क्योंकि यह लोगों के जीवन में महत्वपूर्ण बदलाव ला सकता है।
(दिन भर की शीर्ष प्रौद्योगिकी खबरों के लिए, हमारे तकनीकी न्यूज़लेटर टुडेज़ कैश की सदस्यता लें)
THG: आम तौर पर यह चिंता बनी रहती है कि GenAI में निवेश से उचित रिटर्न नहीं मिल रहा है। आपको क्या लगता है कि GenAI एप्लीकेशन को अपनाने में शुरुआत में क्या गलत हुआ?
शेषु: GenAI एक लक्ष्य तक पहुँचने का साधन है और आप जो हल करने की कोशिश कर रहे हैं, वह आपके साधनों को निर्धारित करेगा। लेकिन हम आम तौर पर सतर्क रहे हैं और एक रूपरेखा तैयार की है। बेशक, जब AGI की बात आती है, तो यह एक पूरी तरह से अलग दृष्टिकोण है। हम प्रौद्योगिकी का एक हिस्सा लेने और इसे अधिक से अधिक सामान्य बनाने की कोशिश कर रहे हैं ताकि यह तकनीकी रूप से शुद्ध हो। इसलिए, विचार यह है कि ऐसा न किया जाए [to simply] GenAI को हर चीज़ पर लागू करें। उदाहरण के लिए, हमारे पास YouTube या Google Maps से जुड़ी बहुत सी परियोजनाएँ हैं जहाँ हम GenAI का उपयोग नहीं करते हैं।
टीएचजी: मतिभ्रम के बारे में बात करें तो, यह बड़े भाषा मॉडल के साथ एक निरंतर समस्या रही है। क्या अशुद्धि एक ऐसा मुद्दा नहीं है जिसे उद्यमों में प्रौद्योगिकी को आगे बढ़ाने से पहले पूरी तरह से हल किया जाना चाहिए?
मनीष गुप्ता: हम निश्चित रूप से इसे एक महत्वपूर्ण समस्या के रूप में पहचानते हैं जो अभी भी अनसुलझी है। इसलिए, अभी तक कोई सिल्वर बुलेट नहीं है, लेकिन कई व्यावहारिक तकनीकें विकसित की गई हैं। इन मॉडलों को आधार बनाने और तथ्यात्मकता सुनिश्चित करने में बहुत काम चल रहा है। आप LLM के आउटपुट को दूसरे ग्राउंडेड मॉडल से जाँच सकते हैं और उन्हें मान्य कर सकते हैं। हम रिट्रीवल ऑगमेंटेड जेनरेशन (RAG) भी करते हैं जहाँ आप स्क्रैच से शुरू नहीं करते हैं बल्कि मॉडल से किसी विशिष्ट डेटा सेट से जानकारी प्राप्त करने के लिए कहते हैं। हमने अब Google I/O कनेक्ट इवेंट में दो मिलियन टोकन संदर्भ विंडो की और उपलब्धता की घोषणा की है। जेन AI तकनीक के बीच एक अंतर्निहित तनाव है, जहाँ आप अगले टोकन की भविष्यवाणी करने और वास्तविकता सुनिश्चित करने के साथ संभाव्य हैं। यह अभी भी बना हुआ है।
टीएचजी: क्या हम भारत में गूगल डीपमाइंड के लिए डेवलपर आधार को बढ़ता हुआ देखेंगे?
मनीष: यदि आप आज इन 1.5 मिलियन डेवलपर्स को देखें जो हमारे जेमिनी मॉडल का उपयोग कर रहे हैं, तो उनमें से एक बड़ी संख्या भारत से आती है। हम भारत को AI के कई आयामों के लिए बहुत उपजाऊ भूमि के रूप में भी देखते हैं, चाहे वह मल्टीमॉडल हो, मोबाइल हो, और वास्तव में, एक और आयाम जिस पर मेरी टीम नज़र रख रही है वह है बहुसांस्कृतिक। अब, हम जानते हैं कि आपको अलग-अलग भाषाओं को समझने से भी आगे जाना होगा, हमें अलग-अलग संस्कृतियों को समझने की ज़रूरत है ताकि हम असमिया में पूछे गए प्रश्नों का उत्तर केवल अंग्रेज़ी के शाब्दिक अनुवाद के साथ न दें। हमें Google DeepMind में स्वागत किए जाने पर बहुत खुशी हुई क्योंकि हमारी टीम समावेशिता के बारे में विचारों और तरीकों का योगदान दे रही थी जो सीधे जेमिनी मॉडल में गए। अंततः हम मानते हैं कि प्रतिनिधित्व की कमी केवल भारत के लिए ही समस्या नहीं है बल्कि वैश्विक स्तर पर बेहद प्रासंगिक है।
टी.एच.बी.: पैमाना कितना महत्वपूर्ण है, और भविष्य में बड़े भाषा मॉडल का आकार किस दिशा में बढ़ेगा?
मनीष: हमने स्पष्ट रूप से देखा है कि जैसे-जैसे इन मॉडलों का आकार बढ़ता गया है; वे स्पष्ट रूप से अधिक शक्तिशाली और अधिक मजबूत होते गए हैं और विभिन्न प्रकार के डेटा, विभिन्न प्रकार की क्वेरीज़ आदि को संभालने में सक्षम हैं। इसमें कोई संदेह नहीं है कि पैमाने ने इन मॉडलों को अधिक शक्तिशाली बनने में मदद की है। क्या पैमाना ही सब कुछ है? हमारा मानना है कि इसका उत्तर नहीं है। इन मॉडलों के पैमाने से परे भी कई चीजें हैं जिनसे निपटना है। हम उन्हें अनंत तक सिर्फ़ मापना जारी नहीं रख सकते।
टीएचबी: एआई एजेंटों के भविष्य के बारे में आप क्या भविष्यवाणी करते हैं?
मनीष: यह उज्ज्वल है। एजेंटिंग क्षमताओं पर भी बहुत सारे रोमांचक काम हो रहे हैं। आप ऐसे एजेंट बनाते हैं जो इन मॉडलों की क्षमताओं का लाभ उठाते हैं, जो खोज करने और तर्क करने में सक्षम होते हैं। आप अलग-अलग सिस्टम बना सकते हैं जो कई एजेंटों से सीखने में सक्षम हैं, और एक एजेंट जो कर सकता है उससे कहीं अधिक शक्तिशाली कुछ कर सकते हैं। शोध समुदाय द्वारा कुछ बहुत ही रोमांचक दिशाएँ अपनाई जा रही हैं। हमने हाल ही में MatFormer फ्रेमवर्क भी पेश किया है जहाँ पैमाने के बजाय विशिष्टता महत्वपूर्ण है। यह हमारी टीम का बहुत ही रोचक, अग्रणी काम है जहाँ आप AI मॉडल इस तरह से बना सकते हैं कि एक बड़े मॉडल में कई छोटे और मध्यम आकार के मॉडल शामिल हों। फिर, आप हाथ में मौजूद कार्य की जटिलता और आपके द्वारा भुगतान की जाने वाली लागत के आधार पर मॉडल चुन सकते हैं। हम क्लाउड की तरह ही Gemini के साथ लोच को सक्षम कर रहे हैं जहाँ आप अपनी ज़रूरत के अनुसार कंप्यूट की मात्रा चुन सकते हैं।
यह एक प्रीमियम लेख है जो विशेष रूप से हमारे ग्राहकों के लिए उपलब्ध है। हर महीने 250+ ऐसे प्रीमियम लेख पढ़ने के लिए
आपने अपनी निःशुल्क लेख सीमा समाप्त कर ली है। कृपया गुणवत्तापूर्ण पत्रकारिता का समर्थन करें।
आपने अपनी निःशुल्क लेख सीमा समाप्त कर ली है। कृपया गुणवत्तापूर्ण पत्रकारिता का समर्थन करें।
आपने पढ़ा है {{डेटा.सेमी.व्यूज़}} से बाहर {{डेटा.cm.maxViews}} मुफ्त लेख.
यह आपका अंतिम निःशुल्क लेख है।