গত দশকে, মাইক্রোসফ্ট, আলিবাবা ক্লাউড এবং অ্যামাজন দ্বারা পরিচালিত ডেটা সেন্টারগুলি দ্রুত সম্প্রসারিত হয়েছে, সার্ভারের সংখ্যা ঐতিহ্যবাহী সুপার কম্পিউটারের সংখ্যাকে ছাড়িয়ে গেছে। এই ডেটা সেন্টারগুলি মূলত আন্তঃসংযোগের জন্য ইথারনেট ব্যবহার করে, ট্রান্সমিশন গতি প্রাথমিক 10Gbps এবং 100Gbps থেকে আজকের সময়ে বিকশিত হচ্ছে। 400Gbps, এবং এখন 800Gbps এর দিকে অগ্রসর হচ্ছে এবং এমনকি 1.6 টিবিপিএস.
তবে, নেটওয়ার্ক ব্যান্ডউইথ বৃদ্ধির তুলনায় সিপিইউ কম্পিউটিং শক্তির বৃদ্ধি পিছিয়ে পড়েছে, যা ঐতিহ্যবাহী সফ্টওয়্যার-ভিত্তিক নেটওয়ার্ক প্রোটোকল স্ট্যাকের দুটি প্রধান বাধা প্রকাশ করে: প্রথমত, সিপিইউগুলিকে ঘন ঘন নেটওয়ার্ক ডেটা স্থানান্তর পরিচালনা করতে হয়, উল্লেখযোগ্য কম্পিউটিং সংস্থান গ্রহণ করতে হয়; দ্বিতীয়ত, বিতরণকৃত স্টোরেজ, বিগ ডেটা এবং মেশিন লার্নিংয়ের মতো অ্যাপ্লিকেশনগুলিতে উচ্চ থ্রুপুট এবং অতি-নিম্ন ল্যাটেন্সির জন্য চাহিদাপূর্ণ প্রয়োজনীয়তা পূরণ করতে তারা লড়াই করে।
রিমোট ডাইরেক্ট মেমোরি অ্যাক্সেস (RDMA) প্রযুক্তি এই সমস্যার একটি মূল সমাধান হয়ে উঠেছে। মূলত উচ্চ-পারফরম্যান্স কম্পিউটিং (HPC) এর জন্য তৈরি, RDMA ডেটা CPU বাইপাস করতে এবং সার্ভার মেমোরির মধ্যে সরাসরি স্থানান্তর করতে সক্ষম করে, যা উল্লেখযোগ্যভাবে ল্যাটেন্সি হ্রাস করে এবং থ্রুপুট উন্নত করে। NVIDIA ConnectX এবং Intel E400 এর মতো 800G/810G ইথারনেট RDMA নেটওয়ার্ক ইন্টারফেস কার্ড (NICs) এর ব্যাপক গ্রহণ, ডেটা সেন্টারগুলিতে RDMA-এর বৃহৎ পরিসরে স্থাপনকে সক্ষম করেছে।
এই NIC গুলি কেবল অতি-উচ্চ-গতির ইথারনেট সমর্থন করে না বরং RoCE (RDMA ওভার কনভার্জড ইথারনেট) বা iWARP এর মতো প্রোটোকলের মাধ্যমে দক্ষ RDMA যোগাযোগ সক্ষম করে। এটি অ্যাপ্লিকেশনগুলিকে CPU ওভারহেড হ্রাস করার সাথে সাথে 400G+ নেটওয়ার্কের ব্যান্ডউইথ সম্পূর্ণরূপে ব্যবহার করতে দেয়। উদাহরণস্বরূপ, বিতরণকৃত স্টোরেজ সিস্টেম (যেমন Ceph এবং NVMe-oF) এবং AI প্রশিক্ষণ কাঠামো (যেমন TensorFlow এবং PyTorch) ডেটা স্থানান্তর দক্ষতা উল্লেখযোগ্যভাবে বৃদ্ধি করার জন্য RDMA NIC গুলিকে ব্যাপকভাবে গ্রহণ করেছে।
৪০০জি ইথারনেট আরডিএমএ এনআইসি সম্পর্কে জানার আগে, আরডিএমএ কী তা বোঝা গুরুত্বপূর্ণ।
RDMA (রিমোট ডাইরেক্ট মেমোরি অ্যাক্সেস) হল একটি নেটওয়ার্কিং প্রযুক্তি যা সার্ভারগুলিকে অপারেটিং সিস্টেম কার্নেল বা CPU-এর সাথে জড়িত না হয়েই উচ্চ গতিতে অন্য সার্ভারের মেমোরি থেকে সরাসরি পড়তে বা লিখতে সক্ষম করে। এর মূল উদ্দেশ্য হল নেটওয়ার্ক যোগাযোগের বিলম্ব কমানো, থ্রুপুট বৃদ্ধি করা এবং CPU রিসোর্স খরচ উল্লেখযোগ্যভাবে কমানো।

বর্তমানে, RDMA-এর তিনটি মূলধারার বাস্তবায়ন রয়েছে: IB (ফলে InfiniBand), RoCE (কনভার্জড ইথারনেটের উপর RDMA) এবং iWARP.
ইনফিনিব্যান্ড (আইবি)
RoCE (আরডিএমএ ওভার কনভার্জড ইথারনেট)
iWARP (ইন্টারনেট ওয়াইড এরিয়া RDMA প্রোটোকল)
RDMA CPU এবং অপারেটিং সিস্টেমের কার্নেলকে বাইপাস করে এক কম্পিউটারের মেমোরি থেকে অন্য কম্পিউটারে সরাসরি ডেটা স্থানান্তর করতে সাহায্য করে। এর ফলে:
জিরো-কপি ডেটা ট্রান্সফার: ব্যবহারকারী এবং কার্নেল স্পেসের মধ্যে ডেটা প্রতিলিপি দূর করে।
কম বিলম্বিতা: ঐতিহ্যবাহী TCP/IP-এর মিলিসেকেন্ডের তুলনায় মাইক্রোসেকেন্ড-স্তরের বিলম্ব অর্জন করে।
উচ্চ ব্যান্ডউইথ: ৪০০Gbps বা তার বেশি পর্যন্ত নেটওয়ার্ক গতি সম্পূর্ণরূপে ব্যবহার করে।
সিপিইউ অফলোডিং: CPU-এর সম্পৃক্ততা হ্রাস করে, অন্যান্য কাজের জন্য সম্পদ মুক্ত করে।
দুটি প্রাথমিক RDMA প্রোটোকল ইথারনেট পরিবেশে প্রাধান্য পায়:
RoCE (আরডিএমএ ওভার কনভার্জড ইথারনেট):
iWARP (ইন্টারনেট ওয়াইড এরিয়া RDMA প্রোটোকল):
TCP/IP-র উপর নির্মিত, এটি বিদ্যমান ইথারনেট অবকাঠামোর সাথে একীভূত হয় তবে RoCE-এর তুলনায় কিছুটা বেশি ল্যাটেন্সি এবং CPU ওভারহেড খরচ করে। এটি ওয়াইড-এরিয়া নেটওয়ার্কের জন্য বেশি উপযুক্ত।

ইথারনেট RDMA NIC হল উচ্চ-কার্যক্ষমতাসম্পন্ন নেটওয়ার্ক হার্ডওয়্যার যা একটি কম্পিউটারকে CPU-কে জড়িত না করেই সরাসরি একটি দূরবর্তী হোস্টের মেমরি অ্যাক্সেস করতে দেয়। এটি উল্লেখযোগ্যভাবে ল্যাটেন্সি হ্রাস করে, থ্রুপুট বৃদ্ধি করে এবং CPU ওভারহেড কমায়।
নেটওয়ার্ক স্টোরেজ এবং ক্লাউড কম্পিউটিংয়ের মতো ডেটা সেন্টার পরিস্থিতিতে ইথারনেট RDMA প্রযুক্তি ব্যাপক মনোযোগ এবং স্থাপনা অর্জনের সাথে সাথে, ইথারনেট RDMA NIC-গুলি - এই প্রযুক্তি সক্ষম করার মূল উপাদান - ক্রমবর্ধমান গুরুত্বপূর্ণ ভূমিকা পালন করছে।
একদিকে, NIC ইথারনেট RDMA প্রযুক্তির সবচেয়ে জটিল দিকগুলি বাস্তবায়নের জন্য দায়ী, যেমন প্রোটোকল অফলোডিং, নির্ভরযোগ্য ট্রান্সমিশন এবং কনজেশন নিয়ন্ত্রণ। বিপরীতে, সুইচগুলির জন্য সাধারণত তুলনামূলকভাবে সহজ কার্যকারিতা প্রয়োজন হয়, যেমন অগ্রাধিকার-ভিত্তিক প্রবাহ নিয়ন্ত্রণ (PFC) এবং স্পষ্ট কনজেশন বিজ্ঞপ্তি (ECN)।
অন্যদিকে, হার্ডওয়্যারে প্রসেসিং অফলোড করার অর্থ হল NIC-কে রিমোট মেমোরি পড়ার এবং লেখার জন্য প্রয়োজনীয় স্টেট তথ্য সংরক্ষণ করতে হবে। তবে, NIC-এর অন-চিপ ক্যাশে এবং প্রসেসিং লজিক রিসোর্স সীমিত, যার ফলে কার্যকর নকশা এবং অপ্টিমাইজেশনের জন্য NIC-এর মাইক্রোআর্কিটেকচার সম্পর্কে দৃঢ় ধারণা থাকা অপরিহার্য।
৪০০জি ইথারনেট আরডিএমএ নেটওয়ার্ক কার্ডগুলি উচ্চ-কার্যক্ষমতা সম্পন্ন নেটওয়ার্কিং প্রযুক্তির এক শীর্ষস্থানীয় প্রতিনিধিত্ব করে, যা আধুনিক ডেটা সেন্টার, উচ্চ-কার্যক্ষমতা সম্পন্ন কম্পিউটিং (এইচপিসি) এবং ক্লাউড পরিবেশের ক্রমবর্ধমান চাহিদা মেটাতে ডিজাইন করা হয়েছে। সিপিইউ হস্তক্ষেপ ছাড়াই সিস্টেমগুলির মধ্যে সরাসরি মেমোরি অ্যাক্সেস সক্ষম করে, এই কার্ডগুলি অতি-নিম্ন ল্যাটেন্সি, উচ্চ থ্রুপুট এবং উল্লেখযোগ্য সিপিইউ অফলোডিং সরবরাহ করে। এই নিবন্ধটি ৪০০জি ইথারনেট আরডিএমএ নেটওয়ার্ক কার্ডগুলির মূল বৈশিষ্ট্য, অ্যাপ্লিকেশন, প্রযুক্তিগত বিবরণ এবং ভবিষ্যতের প্রবণতাগুলি অন্বেষণ করে।
অতি-উচ্চ ব্যান্ডউইথ: একক-পোর্ট 400Gbps (যেমন, QSFP-DD বা OSFP ইন্টারফেস), একাধিক নিম্ন-গতির NIC প্রতিস্থাপন করে।
RDMA সমর্থন: RoCEv2 (UDP/IP-ভিত্তিক) অথবা iWARP (TCP/IP-ভিত্তিক) এর মাধ্যমে শূন্য-অনুলিপি, কার্নেল-বাইপাস ডেটা স্থানান্তর সক্ষম করে।
হার্ডওয়্যার অফলোড:
কম লেটেন্সি: এন্ড-টু-এন্ড ল্যাটেন্সি <1 μs পর্যন্ত কম হতে পারে (নেটওয়ার্ক কনফিগারেশনের উপর নির্ভর করে)।
মাল্টি-প্রটোকল সামঞ্জস্যতা: সাধারণত ইথারনেট (400G), ইনফিনিব্যান্ড (যেমন, NVIDIA ConnectX-7), এবং স্টোরেজ প্রোটোকল (যেমন, NVMe-oF) সমর্থন করে।
শীর্ষস্থানীয় বিক্রেতারা উন্নত 400G RDMA সমাধান প্রদান করে:

৪০০জি ইথারনেট আরডিএমএ নেটওয়ার্ক কার্ডগুলি মূলত এমন নেটওয়ার্ক পরিবেশে ব্যবহৃত হয় যেখানে উচ্চ ব্যান্ডউইথ এবং কম ল্যাটেন্সি প্রয়োজন, যেমন হাই-পারফরম্যান্স কম্পিউটিং (এইচপিসি), কৃত্রিম বুদ্ধিমত্তা (এআই), বিগ ডেটা অ্যানালিটিক্স এবং ক্লাউড কম্পিউটিং। নীচে কিছু নির্দিষ্ট অ্যাপ্লিকেশন পরিস্থিতি দেওয়া হল:
এই সমস্ত অ্যাপ্লিকেশন পরিস্থিতিতে উচ্চ-ব্যান্ডউইথ, কম-লেটেন্সি নেটওয়ার্ক সংযোগের প্রয়োজন হয়। তাদের উচ্চ কর্মক্ষমতা এবং কম ল্যাটেন্সির সাথে, 400G ইথারনেট RDMA নেটওয়ার্ক কার্ডগুলি এই অ্যাপ্লিকেশনগুলির কর্মক্ষমতা এবং দক্ষতা উল্লেখযোগ্যভাবে বৃদ্ধি করতে পারে।
সমস্যা: ৪০০জি ট্র্যাফিক বিস্ফোরণ সহজেই প্যাকেট ক্ষতির কারণ হতে পারে এবং RoCEv400 প্যাকেট ক্ষতির প্রতি অত্যন্ত সংবেদনশীল।
সলিউশন:
DCQCN (ডেটা সেন্টার কোয়ান্টাইজড কনজেশন নোটিফিকেশন) অথবা TIMELY (লেটেন্সি-ভিত্তিক কনজেশন নিয়ন্ত্রণ) সক্ষম করুন।
PFC + ECN ব্যবহার করে লসলেস ইথারনেট কনফিগার করুন, একই সাথে PFC দ্বারা সৃষ্ট হেড-অফ-লাইন (HOL) ব্লকিং এড়ান।
সমস্যা: ৪০০জি লাইন রেটের জন্য PCIe ৪.০ x১৬ অথবা PCIe ৫.০ x৮ ব্যান্ডউইথ (~৬৪GB/s) প্রয়োজন।
সলিউশন:
PCIe 5.0 স্লট ব্যবহার করুন (প্রতি লেনে 32GT/s)।
মাল্টি-কিউ কনফিগারেশনের মাধ্যমে অপ্টিমাইজ করুন, প্রতিটি CPU কোরকে একটি স্বাধীন সারিতে আবদ্ধ করুন।
সমস্যা: ৪০০জি এনআইসি ২৫-৪০ ওয়াট বিদ্যুৎ খরচ করতে পারে, যার জন্য শক্তিশালী শীতলকরণের প্রয়োজন হয়।
সলিউশন:
হিট সিঙ্ক বা সক্রিয় কুলিং ফ্যান সহ NIC গুলি বেছে নিন।
চ্যাসিস এয়ারফ্লো ডিজাইন অপ্টিমাইজ করুন।
ডেটা সেন্টার নেটওয়ার্কগুলি দ্রুত ১০০G/২০০G থেকে ৪০০G এবং তার পরেও বিকশিত হওয়ার সাথে সাথে, ইথারনেট RDMA নেটওয়ার্ক কার্ডগুলি পরবর্তী প্রজন্মের উচ্চ-কার্যক্ষমতাসম্পন্ন অবকাঠামোর মূল উপাদান হয়ে উঠছে। নিম্নলিখিত প্রবণতাগুলি RDMA ইকোসিস্টেমের বর্তমান গতিপথ এবং ভবিষ্যতের দিক তুলে ধরে:
যদিও ইনফিনিব্যান্ড দীর্ঘদিন ধরে উচ্চ-কার্যক্ষমতাসম্পন্ন যোগাযোগের জন্য স্বর্ণমান হিসেবে বিবেচিত, এর মালিকানাধীন প্রকৃতি এবং উচ্চ ব্যয় বৃহৎ পরিসরে গ্রহণ সীমিত করেছে। বিপরীতে, RoCEv2, একটি উন্মুক্ত এবং ইথারনেট-ভিত্তিক RDMA সমাধান, এর কর্মক্ষমতা, সাশ্রয়ী মূল্য এবং বাস্তুতন্ত্রের পরিপক্কতার কারণে একটি আকর্ষণীয় বিকল্প প্রদান করে।
AWS, Alibaba Cloud এবং Microsoft Azure-এর মতো হাইপারস্কেল ক্লাউড প্রদানকারীরা AI প্রশিক্ষণ, স্টোরেজ অ্যাক্সেস এবং মাল্টি-টেন্যান্ট কম্পিউটিং দক্ষতা ত্বরান্বিত করার জন্য তাদের অবকাঠামোতে RoCEv2-কে ক্রমবর্ধমানভাবে একীভূত করছে।
কম স্থাপনার খরচ: RoCEv2 স্ট্যান্ডার্ড ইথারনেট হার্ডওয়্যারে চলে, যা বিদ্যমান সুইচ এবং ক্যাবলিং অবকাঠামোর পুনঃব্যবহার সক্ষম করে।
সরলীকৃত অপারেশন: বেশিরভাগ ইঞ্জিনিয়ারিং টিমের কাছে ইথারনেট ভালোভাবে বোঝা যায় এবং রক্ষণাবেক্ষণ করা সহজ।
উন্নত মাপযোগ্যতা: RoCEv2 লেয়ার 3 রাউটিং সমর্থন করে, যা এটিকে বৃহৎ-স্কেল, মাল্টি-র্যাক এবং ক্রস-সাবনেট স্থাপনার জন্য উপযুক্ত করে তোলে।
এই বৈশিষ্ট্যগুলি RoCEv2 কে আধুনিক ডেটা সেন্টারগুলির জন্য একটি উচ্চ-কার্যক্ষমতাসম্পন্ন কিন্তু সাশ্রয়ী পছন্দ করে তোলে।
(১) ৮০০জি/১.৬টি ইথারনেট দিগন্তে রয়েছে
সিলিকন স্যুইচিং (যেমন, ব্রডকম টমাহক ৫) এবং PHY স্ট্যান্ডার্ডের উদ্ভাবনের মাধ্যমে, শিল্পটি ৮০০জি এবং ১.৬টি ইথারনেট গ্রহণের জন্য প্রস্তুতি নিচ্ছে। পরবর্তী প্রজন্মের RDMA NICs—যেমন NVIDIA-এর আসন্ন ConnectX-5—উচ্চতর পোর্ট ঘনত্ব, কম বিদ্যুৎ খরচ এবং বর্ধিত থ্রুপুট সমর্থন করবে, যা স্কেলেবল কম্পিউটিং অবকাঠামোতে RDMA-এর ভূমিকা আরও উন্নত করবে।
(২) ডিপিইউ ইন্টিগ্রেশন: আরডিএমএ + ইন্টেলিজেন্ট অফলোডিং
ডেটা প্রসেসিং ইউনিট (DPUs) স্মার্ট নেটওয়ার্কিংয়ের পরবর্তী ধাপ, যা ঐতিহ্যবাহী NIC ক্ষমতাগুলিকে প্রোগ্রামেবল কম্পিউটের সাথে একত্রিত করে। DPUs-তে RDMA কার্যকারিতা এম্বেড করে, এই ডিভাইসগুলি CPU থেকে নেটওয়ার্ক, স্টোরেজ এবং সুরক্ষা প্রক্রিয়াকরণ অফলোড করতে পারে - যা AI ওয়ার্কলোড এবং ডিসাগ্রিগেটেড স্টোরেজের জন্য এন্ড-টু-এন্ড অ্যাক্সিলারেশন সক্ষম করে।
উদাহরণস্বরূপ, NVIDIA-এর BlueField DPU RDMA, IPsec, এবং NVMe-oF ত্বরণকে একীভূত করে এবং পরবর্তী প্রজন্মের হাইপারকনভার্জড অবকাঠামোর একটি মূল উপাদান হয়ে উঠছে।
(৩) স্মার্টএনআইসি ইন্টেলিজেন্স: ইন-নেটওয়ার্ক কম্পিউটিং
স্মার্টএনআইসিগুলি সাধারণ ডেটা মুভার থেকে প্রোগ্রামেবল ইন-নেটওয়ার্ক কম্পিউট নোডে বিকশিত হচ্ছে যার বৈশিষ্ট্যগুলি হল:
এই প্রবণতা RDMA NIC গুলিকে বিতরণকৃত সিস্টেমের জন্য বুদ্ধিমান এক্সিকিউশন ইঞ্জিনে রূপান্তরিত করে, যা ঐতিহ্যবাহী নেটওয়ার্ক ত্বরণের চেয়ে অনেক বেশি।
400G ইথারনেট RDMA নেটওয়ার্ক কার্ডগুলি ডেটা সেন্টার, HPC এবং AI-চালিত অ্যাপ্লিকেশনগুলির জন্য রূপান্তরকারী। হার্ডওয়্যার অফলোডিং, RoCEv2 বা iWARP প্রোটোকল এবং উন্নত কনজেশন নিয়ন্ত্রণের সুবিধা গ্রহণ করে, এই কার্ডগুলি ন্যূনতম ল্যাটেন্সি এবং CPU ওভারহেড সহ অতুলনীয় কর্মক্ষমতা প্রদান করে। সর্বোত্তম স্থাপনার জন্য নেটওয়ার্ক কনফিগারেশন, PCIe ব্যান্ডউইথ এবং তাপীয় নকশার প্রতি যত্নবান মনোযোগ অত্যন্ত গুরুত্বপূর্ণ। শিল্পটি 800G এবং DPU-সমন্বিত সমাধানের দিকে এগিয়ে যাওয়ার সাথে সাথে, RDMA প্রযুক্তি বিতরণকৃত কম্পিউটিং এবং স্টোরেজ কর্মক্ষমতার সীমানা পুনরায় সংজ্ঞায়িত করতে থাকবে।