दीपसेक के नए चैटबोट में एक प्रभावशाली परिचय है: "हाय, मैं बनाया गया था ताकि आप कुछ भी पूछ सकें और एक जवाब प्राप्त कर सकें जो आपको आश्चर्यचकित भी कर सके।" यह एआई, चीनी स्टार्टअप दीपसेक का एक उत्पाद, तेजी से एक प्रमुख बाजार खिलाड़ी बन गया है, यहां तक कि एनवीडिया के स्टॉक मूल्य में एक महत्वपूर्ण गिरावट में भी योगदान देता है।

दीपसेक की प्रतिस्पर्धी बढ़त अपने अभिनव वास्तुकला और प्रशिक्षण विधियों में निहित है। प्रमुख प्रौद्योगिकियों में शामिल हैं:
- मल्टी-टोकन भविष्यवाणी (एमटीपी): व्यक्तिगत रूप से शब्दों की भविष्यवाणी करने के बजाय, एमटीपी एक साथ कई शब्दों का अनुमान लगाता है, सटीकता और दक्षता को बढ़ाता है।
- विशेषज्ञों का मिश्रण (एमओई): यह वास्तुकला कई तंत्रिका नेटवर्क का उपयोग करता है, प्रशिक्षण में तेजी और प्रदर्शन में सुधार करता है। दीपसेक वी 3 256 नेटवर्क का उपयोग करता है, प्रत्येक टोकन के लिए आठ को सक्रिय करता है।
- मल्टी-हेड लेटेंट ध्यान (एमएलए): एमएलए महत्वपूर्ण जानकारी के जोखिम को कम करने के लिए बार-बार महत्वपूर्ण वाक्य भागों पर ध्यान केंद्रित करता है।
दीपसेक ने शुरू में 2048 जीपीयू का उपयोग करके अपने शक्तिशाली डीपसेक वी 3 न्यूरल नेटवर्क को केवल $ 6 मिलियन के लिए प्रशिक्षित करने का दावा किया था। हालांकि, सेमियालिसिस ने एक बहुत बड़ा बुनियादी ढांचा प्रकट किया: लगभग 50,000 एनवीडिया हॉपर जीपीयू, जिसमें 10,000 H800S, 10,000 H100 और अतिरिक्त H20S शामिल हैं, कई डेटा केंद्रों में फैले हुए हैं। यह लगभग $ 1.6 बिलियन के कुल सर्वर निवेश का प्रतिनिधित्व करता है, जिसमें परिचालन खर्च $ 944 मिलियन का अनुमान है।

चाइनीज हेज फंड हाई-फ्लायर की सहायक कंपनी दीपसेक अपने डेटा सेंटरों का मालिक है, जो अनुकूलन और नवाचार कार्यान्वयन पर अद्वितीय नियंत्रण प्रदान करती है। यह स्व-वित्त पोषित दृष्टिकोण चपलता और तेजी से निर्णय लेने को बढ़ावा देता है। कंपनी शीर्ष प्रतिभा को भी आकर्षित करती है, कुछ शोधकर्ताओं ने मुख्य रूप से चीनी विश्वविद्यालयों से सालाना 1.3 मिलियन डॉलर से अधिक की कमाई की।

दीपसेक का प्रारंभिक $ 6 मिलियन प्रशिक्षण लागत का दावा भ्रामक है; यह केवल पूर्व-प्रशिक्षण GPU उपयोग को दर्शाता है, अनुसंधान, शोधन, डेटा प्रसंस्करण और बुनियादी ढांचे को छोड़कर। एआई विकास में कंपनी का कुल निवेश $ 500 मिलियन से अधिक है। इस पर्याप्त निवेश के बावजूद, इसकी दुबला संरचना कुशल नवाचार कार्यान्वयन के लिए अनुमति देती है।

दीपसेक की सफलता उद्योग के दिग्गजों के साथ प्रतिस्पर्धा करने के लिए अच्छी तरह से वित्त पोषित स्वतंत्र एआई कंपनियों की क्षमता को प्रदर्शित करती है। हालांकि, इसकी उपलब्धियां निवेश, तकनीकी सफलताओं और एक मजबूत टीम में अरबों के लिए जिम्मेदार हैं, एक क्रांतिकारी बजट नहीं। फिर भी, दीपसेक की लागत प्रतियोगियों की तुलना में काफी कम है। उदाहरण के लिए, दीपसेक ने R1 पर $ 5 मिलियन खर्च किए, चैटगेट के लिए CHATGPT4O के लिए $ 100 मिलियन की तुलना में। यह फुलाया हुआ प्रारंभिक दावों के बावजूद, महत्वपूर्ण लागत लाभ पर प्रकाश डालता है।