Inquiry Cartजांच कार्ट
जांच शॉपिंग कार्टजांच कार्ट
होम - अनुप्रयोगों

एआई नेटवर्किंग

2025 में, कृत्रिम बुद्धिमत्ता (एआई) का तेज़ी से विकास डेटा सेंटर आर्किटेक्चर को नया रूप दे रहा है। मल्टीमॉडल बड़े भाषा मॉडल से लेकर खुले और कुशल फ्रेमवर्क तक, एआई नवाचार की मुख्य प्रेरक शक्ति बन गया है। एआई मॉडल का पैमाना करोड़ों मापदंडों से बढ़कर खरबों के स्तर तक पहुँच रहा है, जिसमें हज़ारों या यहाँ तक कि लाखों GPU को समानांतर रूप से प्रशिक्षण देने की आवश्यकता होती है। उदाहरण के लिए, ओपनएआई'GPT-4o और इसी तरह के मॉडलों को कुशल अनुमान और प्रशिक्षण के लिए रीयल-टाइम डेटा सिंक्रोनाइज़ेशन की आवश्यकता होती है। इसके लिए न केवल TB/s स्तर पर डेटा थ्रूपुट की आवश्यकता होती है, बल्कि किसी भी अड़चन को दूर करने के लिए माइक्रोसेकंड-स्तर की विलंबता और उच्च विश्वसनीयता की भी आवश्यकता होती है।

 

इस पृष्ठभूमि में, पारंपरिक 100G/200G नेटवर्क इंटरकनेक्ट अब ज़रूरतों को पूरा नहीं कर सकते। 400G/800G OSFP ऑप्टिकल मॉड्यूल एक ज़्यादा कॉम्पैक्ट और कुशल इंटरकनेक्शन समाधान प्रदान करते हैं, जबकि DAC (डायरेक्ट अटैच केबल) और AOC (एक्टिव ऑप्टिकल केबल) कम दूरी के कनेक्शन के लिए पसंदीदा विकल्प हैं, जो लागत और बिजली की खपत को प्रभावी ढंग से अनुकूलित करते हैं। AI अब सिर्फ़ एल्गोरिथम नवाचार तक सीमित नहीं है, बल्कि एक सिस्टम-स्तरीय इंजीनियरिंग प्रयास है जो भौतिक बुनियादी ढाँचे के साथ गहराई से एकीकृत है।

एआई नेटवर्किंग

 

नवीनतम AI मॉडल और उनकी कंप्यूटिंग मांगों का अवलोकन

2025 में एआई परिदृश्य बहुमुखी प्रतिभा और ओपन-सोर्स नवाचार द्वारा परिभाषित होगा। कई प्रमुख मॉडल इस बात पर प्रकाश डालते हैं कि ये प्रगति इंटरकनेक्ट की माँगों को कैसे नया रूप दे रही हैं:

जीपीटी-4o (ओपनएआई)

टेक्स्ट, इमेज और स्पीच में अपनी मज़बूत मल्टीमॉडल प्रोसेसिंग क्षमताओं के लिए प्रसिद्ध, GPT-4o हज़ारों GPU पर सिंक्रोनाइज़्ड ट्रेनिंग पर निर्भर करता है। प्रत्येक GPU को सैकड़ों GB/s पर डेटा एक्सचेंज की आवश्यकता होती है, और कोई भी इंटरकनेक्ट अड़चन ट्रेनिंग के समय को काफ़ी बढ़ा सकती है।

क्लाउड 3.7 सॉनेट (मानवीय)

कोडिंग और जटिल तर्क कार्यों में विशेषज्ञता प्राप्त, क्लाउड 3.7 सॉनेट को कुशल अनुमान बनाए रखने के लिए रीयल-टाइम डेटा स्ट्रीम की आवश्यकता होती है। अल्ट्रा-लो-लेटेंसी इंटरकनेक्ट आवश्यक हैं, जिसमें 800G ऑप्टिकल मॉड्यूल लगभग 5 pJ/बिट की ऊर्जा दक्षता प्रदान करते हैं।

जेमिनी 2.5 (गूगल)

मल्टीमॉडल इंफ़रेंस और वैज्ञानिक अनुसंधान अनुप्रयोगों में उत्कृष्टता प्राप्त करते हुए, जेमिनी 2.5 उच्च बैंडविड्थ और बड़े पैमाने पर वितरित संचार पर ज़ोर देता है। इसका प्रदर्शन DWDM सिस्टम और उच्च-गति वाले ईथरनेट इंटरकनेक्ट पर काफ़ी हद तक निर्भर करता है।

ग्रोक 3/4 (xAI)

बिल्ट-इन वॉइस मोड और कुशल अनुमान क्षमताओं के साथ, ग्रोक 3/4 को आमतौर पर GB200 क्लस्टर्स में तैनात किया जाता है। प्रत्येक GPU को दोगुना प्रदर्शन प्राप्त करने के लिए 800GbE इंटरफ़ेस की आवश्यकता होती है।

लामा 3 / डीपसीक वी3 (मेटा / डीपसीक)

ओपन-सोर्स मॉडल के अग्रणी प्रतिनिधियों के रूप में, लामा 3 और डीपसीक V3 उच्च प्रदर्शन और अनुकूलनशीलता पर ज़ोर देते हैं। उनका वितरित प्रशिक्षण 400G/800G इंटरकनेक्ट पर निर्भर करता है, जिससे समग्र दक्षता 20-25% बढ़ जाती है।

 

एआई मॉडल

डेवलपर

मुख्य विशेषताएं

कंप्यूट और इंटरकनेक्ट आवश्यकताएँ

GPT-4oOpenAIबहुविधीय (पाठ, छवि, भाषण); उन्नत तर्क; o1/o3 प्रकारों का समर्थन करता है

बड़े पैमाने पर GPU क्लस्टर सिंक्रनाइज़ेशन की आवश्यकता होती है, प्रशिक्षण के दौरान प्रति-GPU डेटा एक्सचेंज सैकड़ों GB/s तक पहुंच जाता है; इंटरकनेक्ट अड़चनें प्रशिक्षण समय को 2-3 गुना तक बढ़ा सकती हैं।

क्लाउड 3.7 सॉनेटanthropicकोडिंग और जटिल कार्यों में कुशल; लागत-कुशल

अनुमान वास्तविक समय डेटा स्ट्रीमिंग पर निर्भर करता है, तथा समवर्ती प्रश्नों का समर्थन करने के लिए अल्ट्रा-लो-लेटेंसी इंटरकनेक्ट की मांग करता है; 800G ऑप्टिक्स ऊर्जा लागत को ~5 pJ/बिट तक कम कर सकता है।

मिथुन 2.5गूगलकुशल मल्टीमॉडल प्रसंस्करण; डेवलपर्स और अनुसंधान के लिए अनुकूलित

प्रशिक्षण में समानांतर कंप्यूटिंग पर जोर दिया जाता है, जिसमें इंटरकनेक्ट आवश्यकताओं को DWDM (घने तरंगदैर्ध्य विभाजन मल्टीप्लेक्सिंग) बहु-तरंगदैर्ध्य संचरण को संभालने के लिए उच्च बैंडविड्थ पर केंद्रित किया जाता है।

ग्रोक 3/4Xaiकुशल अनुमान, ध्वनि-मोड समर्थन, ओपन-सोर्स अनुकूल

आमतौर पर बड़े पैमाने के क्लस्टरों (जैसे, GB200) में तैनात किया जाता है, जहां प्रत्येक GPU को 800 × प्रदर्शन स्केलिंग प्राप्त करने के लिए 2GbE कनेक्टिविटी की आवश्यकता होती है।

लामा 3 / डीपसीक V3मेटा / डीपसीकओपन-सोर्स, उच्च-प्रदर्शन, अनुकूलन योग्य प्रशिक्षण

वितरित प्रशिक्षण क्रॉस-नोड संचार पर निर्भर करता है, जिसमें 400G/800G इंटरकनेक्ट समग्र दक्षता को ~25% तक बढ़ा देता है।

 

इन मॉडलों की एक सामान्य विशेषता है: ये विशेषज्ञों के मिश्रण (MoE) या इसी तरह के आर्किटेक्चर पर निर्भर करते हैं, जिसके लिए लगातार ऑल-टू-ऑल संचार की आवश्यकता होती है। GPT-4o जैसे अति-बड़े मॉडलों के प्रशिक्षण में पेटाबाइट-स्तरीय डेटा विनिमय शामिल हो सकता है, और अपर्याप्त इंटरकनेक्ट नेटवर्क लागत को 70% से अधिक बढ़ा सकते हैं।

 

एआई नेटवर्किंग

 

एआई कंप्यूटिंग में इंटरकनेक्ट चुनौतियाँ

एआई प्रशिक्षण और अनुमान का मूल विशाल GPU क्लस्टरों का समन्वयन है। उदाहरण के लिए, एक NVIDIA GB200 क्लस्टर में, प्रत्येक GPU को PCIe Gen800 प्रत्यक्ष संचार का समर्थन करने और CPU की रुकावटों से बचने के लिए 2GbE (400×6GbE) कनेक्टिविटी की आवश्यकता होती है। मुख्य चुनौतियाँ इस प्रकार हैं:

  • उच्च बैंडविड्थ मांग: एआई कार्यभार को मॉडल पैरामीटर सिंक्रनाइज़ेशन के लिए प्रति सेकंड टेराबाइट्स डेटा ट्रांसफर की आवश्यकता होती है।
  • अल्ट्रा-लो लेटेंसीक्लाउड जैसे मॉडलों के साथ कोड जनरेशन जैसे अनुमान कार्यों के लिए माइक्रोसेकंड-स्तर की प्रतिक्रिया की आवश्यकता होती है। थोड़ी सी भी देरी प्रशिक्षण समय को दोगुना कर सकती है।
  • अनुमापकता: सैकड़ों से लेकर हजारों GPUs को रेल-ओनली नेटवर्क के लिए समर्थन की आवश्यकता होती है, जहां कनेक्शन केवल आवश्यक नोड्स के बीच ही स्थापित किए जाते हैं।
  • ऊर्जा दक्षता और लागत: एआई डेटा सेंटर भारी मात्रा में बिजली की खपत करते हैं, और इंटरकनेक्ट दक्षता में सुधार करके 50% तक ऊर्जा की बचत की जा सकती है।

 

AI के लिए प्रमुख इंटरकनेक्ट समाधान: OSFP, DAC और AOC

1. ओएसएफपी ऑप्टिकल मॉड्यूल

ऑप्टिकल स्मॉल फॉर्म-फैक्टर प्लगेबल (OSFP) 400G/800G स्पीड को सपोर्ट करता है और सिलिकॉन फोटोनिक्स (SiPh) या EML मॉड्यूलेटर का लाभ उठाता है। AI परिनियोजन में, OSFP मॉड्यूल का उपयोग लंबी-पहुँच (>100 मीटर) ट्रांसमिशन के लिए किया जाता है, जिससे 4 Tbps तक की द्विदिशात्मक कनेक्टिविटी संभव होती है। उदाहरण के लिए, इंटेल के OCI चिपसेट कम बिजली खपत (~5 pJ/बिट) प्राप्त करने के लिए DWDM का उपयोग करते हैं।

2. डीएसी (डायरेक्ट अटैच केबल)

कम दूरी (<7 मीटर) के इन-रैक कनेक्शनों के लिए डिज़ाइन किया गया एक कॉपर-आधारित समाधान, DAC ऑप्टिकल-इलेक्ट्रिकल रूपांतरण की आवश्यकता के बिना एक लागत-प्रभावी विकल्प प्रदान करता है। AI क्लस्टर्स में, AMD Pensando Pollara 400 NIC जैसे समाधान, डेटा ट्रांसफर को तेज़ करने के लिए RDMA (रिमोट डायरेक्ट मेमोरी एक्सेस) का समर्थन करते हुए 400Gbps बैंडविड्थ प्रदान करने के लिए DAC का उपयोग करते हैं।

3. एओसी (एक्टिव ऑप्टिकल केबल)

एकीकृत ऑप्टिकल ट्रांसीवरों से युक्त, AOC मध्यम-पहुंच (7-100 मीटर) कनेक्शनों के लिए उपयुक्त हैं। ये उच्च विश्वसनीयता प्रदान करते हैं और पोर्ट संदूषण से बचने में मदद करते हैं। AI परिवेशों में, AOC का व्यापक रूप से समानांतर केबलिंग के लिए उपयोग किया जाता है, जो 800G डेटा सेंटर परिनियोजन का समर्थन करते हैं।

एआई नेटवर्किंग

 

व्यावहारिक अनुप्रयोगों में, ये प्रौद्योगिकियां सीधे तौर पर AI प्रदर्शन को बढ़ाती हैं:

प्रशिक्षण चरण: उदाहरण के लिए, लामा 3 के वितरित प्रशिक्षण में, GPU के बीच कम विलंबता संचार सुनिश्चित करने के लिए 400G SR4 मॉड्यूल का उपयोग किया जाता है, जिससे उपयोगिता में सुधार होता है।

अनुमान चरण: जेमिनी 2.5 की वास्तविक समय प्रसंस्करण 800 Gbps डेटा स्थानांतरण प्राप्त करने के लिए 3200G AOC पर निर्भर करती है।

मामले का अध्ययन: ओपनएआई का स्टारगेट क्लस्टर कस्टम 800GbE NIC का उपयोग करता है, जिसमें प्रत्येक GPU 8× OSFP पोर्ट से लैस है, जो 2× नेटवर्क प्रदर्शन प्रदान करता है। AMD का Vulcano NIC 800 Gbps थ्रूपुट प्रदान करता है और UC 1.0 मानक का समर्थन करता है।

खुला स्रोत और मापनीयता: उदाहरण के लिए, डीपसीक वी3 इंटरकनेक्ट को अनुकूलित करने के लिए आरडीएमए का लाभ उठाता है, जिससे ब्रिजिंग लागत कम हो जाती है।

व्यावहारिक परिनियोजन में, इन इंटरकनेक्ट तकनीकों का अक्सर संयोजन में उपयोग किया जाता है: DAC और AOC आसन्न रैक के भीतर या उनके बीच कम दूरी के कनेक्शन के लिए सबसे उपयुक्त हैं, जो कम लागत, कम विलंबता और बड़े पैमाने पर सरलीकृत केबलिंग प्रदान करते हैं। दूसरी ओर, OSFP ऑप्टिकल मॉड्यूल मुख्य रूप से इंटर-रैक या यहाँ तक कि इंटर-डेटा हॉल कनेक्शन के लिए परिनियोजित किए जाते हैं, जो लंबी दूरी पर उच्च बैंडविड्थ, स्थिरता और मापनीयता प्रदान करते हैं। यह स्तरित दृष्टिकोण डेटा केंद्रों को लागत, बिजली की खपत और प्रदर्शन को संतुलित करने की अनुमति देता है, जिससे बड़े पैमाने के AI क्लस्टरों की प्रशिक्षण और अनुमान संबंधी आवश्यकताओं का समर्थन होता है।

 

संक्षेप में, उन्नत एआई मॉडलों के साथ उच्च गति इंटरकनेक्ट तकनीकों का एकीकरण डेटा सेंटर नवाचार के अगले युग को आकार दे रहा है। नवीनतम एआई मॉडलों को 400G/800G इंटरकनेक्ट के साथ जोड़ना न केवल तकनीकी तालमेल को प्रदर्शित करता है, बल्कि एआई पारिस्थितिकी तंत्र में बुनियादी ढाँचे की महत्वपूर्ण भूमिका को भी उजागर करता है। इंटरकनेक्ट तकनीक केवल कृत्रिम बुद्धिमत्ता को सक्षम बनाने वाली ही नहीं है, बल्कि इसके भविष्य के विकास की आधारशिला भी है।

मेल खाने वाले उत्पाद