दीपसेक के अभिनव चैटबॉट ने एआई बाजार में एक महत्वपूर्ण प्रभाव डाला है, यहां तक कि एनवीडिया के शेयर मूल्य में उल्लेखनीय गिरावट भी। कंपनी का एआई मॉडल, जो अपनी उन्नत वास्तुकला और प्रशिक्षण विधियों के लिए जाना जाता है, उपयोगकर्ताओं को आश्चर्यजनक और व्यावहारिक उत्तर प्रदान करने की क्षमता के साथ एक अनूठा अनुभव प्रदान करता है।
दीपसेक का मॉडल कई अत्याधुनिक प्रौद्योगिकियों के उपयोग के कारण बाहर खड़ा है:
मल्टी-टोकन भविष्यवाणी (एमटीपी) : यह विधि मॉडल को एक साथ कई शब्दों की भविष्यवाणी करने की अनुमति देती है, एक साथ एक वाक्य के विभिन्न भागों का विश्लेषण करके सटीकता और दक्षता दोनों को बढ़ाती है।
विशेषज्ञों का मिश्रण (एमओई) : डीपसेक वी 3 256 तंत्रिका नेटवर्क का उपयोग करता है, जिसमें प्रत्येक टोकन प्रसंस्करण कार्य के लिए आठ सक्रिय होते हैं, एआई प्रशिक्षण को तेज करते हैं और प्रदर्शन को बढ़ाते हैं।
मल्टी-हेड लेटेंट ध्यान (एमएलए) : यह तंत्र एक वाक्य के सबसे महत्वपूर्ण हिस्सों पर ध्यान केंद्रित करता है, जो कि कोई महत्वपूर्ण जानकारी याद नहीं करने के लिए बार-बार महत्वपूर्ण विवरण निकालता है, इस प्रकार डेटा में बारीकियों को पकड़ने की एआई की क्षमता में सुधार होता है।
2048 ग्राफिक्स प्रोसेसर का उपयोग करके केवल $ 6 मिलियन के लिए अपने शक्तिशाली तंत्रिका नेटवर्क, डीपसेक वी 3 को प्रशिक्षित करने के दीपसेक के दावे के बावजूद, आगे के विश्लेषण से उनके बुनियादी ढांचे में अधिक पर्याप्त निवेश का पता चलता है। दीपसेक लगभग 50,000 एनवीडिया हॉपर जीपीयू के साथ एक महत्वपूर्ण कम्प्यूटेशनल सेटअप संचालित करता है, जिसमें एच 800 और एच 100 जैसे विभिन्न मॉडल शामिल हैं, जो कई डेटा केंद्रों में फैले हुए हैं। यह इन्फ्रास्ट्रक्चर एआई प्रशिक्षण, अनुसंधान और वित्तीय मॉडलिंग का समर्थन करता है, जिसमें कुल सर्वर निवेश लगभग 1.6 बिलियन डॉलर और लगभग $ 944 मिलियन की परिचालन लागत है।
चाइनीज हेज फंड हाई-फ्लायर की सहायक कंपनी दीपसेक को 2023 में एआई टेक्नोलॉजीज पर ध्यान केंद्रित करने के लिए बंद कर दिया गया था। क्लाउड प्रदाताओं पर भरोसा करने वाले कई स्टार्टअप्स के विपरीत, डीपसेक अपने डेटा केंद्रों का मालिक है, जो एआई मॉडल अनुकूलन और तेजी से नवाचार कार्यान्वयन पर पूर्ण नियंत्रण की अनुमति देता है। कंपनी की स्व-वित्त पोषित स्थिति इसकी लचीलापन और निर्णय लेने की गति को बढ़ाती है।
दीपसेक प्रमुख चीनी विश्वविद्यालयों से शीर्ष प्रतिभाओं को आकर्षित करता है, कुछ शोधकर्ताओं ने सालाना 1.3 मिलियन डॉलर से अधिक कमाई। हालांकि, कंपनी का प्रशिक्षण केवल 6 मिलियन डॉलर के लिए दीपसेक वी 3 को प्रशिक्षित करने का दावा भ्रामक है, क्योंकि यह आंकड़ा केवल पूर्व-प्रशिक्षण के दौरान जीपीयू उपयोग के लिए जिम्मेदार है और इसमें अनुसंधान, मॉडल शोधन, डेटा प्रसंस्करण और बुनियादी ढांचे की लागत जैसे अन्य महत्वपूर्ण खर्च शामिल नहीं हैं।
अपनी शुरुआत के बाद से, डीपसेक ने एआई विकास में $ 500 मिलियन से अधिक का निवेश किया है। इसकी कॉम्पैक्ट संरचना इसे बड़ी, अधिक नौकरशाही कंपनियों की तुलना में AI नवाचारों को अधिक सक्रिय और प्रभावी ढंग से लागू करने में सक्षम बनाती है। जबकि दीपसेक की सफलता पर्याप्त निवेश, तकनीकी सफलताओं और एक मजबूत टीम द्वारा संचालित होती है, एआई मॉडल के विकास के लिए "क्रांतिकारी बजट" की धारणा कुछ हद तक खत्म हो गई है।
बहरहाल, डीपसेक की लागत अभी भी इसके प्रतिद्वंद्वियों की तुलना में कम है। उदाहरण के लिए, दीपसेक ने R1 मॉडल पर $ 5 मिलियन खर्च किए, जबकि CHATGPT4O के प्रशिक्षण की लागत $ 100 मिलियन है।
चित्र: ensigame.com
चित्र: ensigame.com
चित्र: ensigame.com
चित्र: ensigame.com