Εφαρμογή Πρακτικής: NVIDIA Mellanox MCX631102AN-ADAT – Μεταφορά RDMA/RoCE Χαμηλής Καθυστέρησης & Βελτίωση Απόδοσης Διακομιστή

April 27, 2026

τα τελευταία νέα της εταιρείας για Εφαρμογή Πρακτικής: NVIDIA Mellanox MCX631102AN-ADAT – Μεταφορά RDMA/RoCE Χαμηλής Καθυστέρησης & Βελτίωση Απόδοσης Διακομιστή

Στην κατανεμημένη αποθήκευση, την υψηλής απόδοσης υπολογιστική και τα clusters εκπαίδευσης AI, η καθυστέρηση δικτύου και η υπερχρέωση του CPU έχουν γίνει τα κύρια σημεία συμφόρησης που περιορίζουν την απόδοση του διακομιστή.Ένας πάροχος υπηρεσιών cloud αναβαθμίζει πρόσφατα το backend αποθήκευσης NVMe-oF επιλέγοντας τοNVIDIA Mellanox MCX631102AN-ADATΜε την ανάπτυξη RDMA μέσω Converged Ethernet (RoCEv2), πέτυχαν μεταφορά χαμηλής καθυστέρησης από άκρο σε άκρο και σημαντικά κέρδη απόδοσης του διακομιστή.Η παρούσα μελέτη περιπτώσεων εξετάζει το πώς ο προσαρμογός λειτουργεί σε περιβάλλον παραγωγής.

Προηγούμενο & Πρόκληση: Το TCP/IP Protocol Stack Bottleneck

Η υφιστάμενη υποδομή 25GbE του παρόχου χειριζόταν την κίνηση αποθήκευσης χρησιμοποιώντας την παραδοσιακή στοίβα λογισμικού TCP / IP.Η χρησιμοποίηση της CPU για την ενσωμάτωση και την αποσύνδεση πακέτων ξεπέρασε το 40%Οι αρχιτέκτονες χρειάστηκαν επειγόντως μια λύση που θα μπορούσε να παρακάμψει τη συστοιχία δικτύου πυρήνα,Μείωση των παρεμβολών της CPUΜετά την αξιολόγηση πολλαπλών επιλογών, επέλεξαν τηνMCX631102AN-ADAT ConnectX-6 Lx διπλής θύρας 25GbE SFP28ως βασικό υλικό για την ανακαίνιση των υλικών αποθήκευσης.

Λύση και ανάπτυξη: RDMA/RoCEv2 με αποφόρτιση υλικού

Η ανάπτυξη αντικατέστησε όλους τους διακομιστές αποθήκευσης με τηνMCX631102AN-ADAT κάρτα προσαρμογή Ethernet, που εκτελείται σε λειτουργία χωρίς απώλειες RoCEv2 (χρησιμοποιώντας ECN και PFC).

  • Ενεργοποίηση του SR-IOV και αφιέρωση εικονικών λειτουργιών (VF) σε εικονικές μηχανές αποθήκευσης, παρακάμπτοντας τη συστοιχία δικτύου υπερθεωρητών
  • Διαμόρφωση NVMe over Fabrics (NVMe-oF) με μεταφορά RDMA, εξαλείφοντας εντελώς το TCP overhead
  • Οριακά όρια του θραύστης διακόπτη ρύθμισης για κίνηση RoCE 25GbE χωρίς απώλεια σε όλη τη τοπολογία φύλλου-σπονδυλίου

ΗΕιδικότητες MCX631102AN-ADAT∆εύτερον, οι νέες τεχνολογίες, συμπεριλαμβανομένων των χρονογραφικών σφραγίδων υλικού, της δυναμικής μεταφοράς σύνδεσης (DCT) και της μοτοσικλέτας δέσμευσης ∆εύτερον, οι νέες τεχνολογίες χρησιμοποιήθηκαν πλήρως για να εξασφαλίσουν προβλέψιμη καθυστέρηση υπομικροδευτερολέπτου ακόμη και κάτω από το συνολικό φορτίο 50Gbps..

Μετρούμενα κέρδη απόδοσης και λειτουργικά οφέλη

Μετά την μετανάστευση στηνNVIDIA Mellanox MCX631102AN-ADAT-από υφάσματα, καταγράφηκαν οι ακόλουθες μετρήσεις:

Μετρική Πριν (TCP/IP 25GbE) Μετά (RoCEv2 με MCX631102AN-ADAT)
Η NVMe-oF διαβάζει καθυστέρηση (P99) 215 μs 18 μs
Χρησιμοποίηση CPU (οδός εισόδου/εξόδου αποθήκευσης) 41% (ενιαίου πυρήνα κορεσμένο) 7% (διανεμημένα σε πυρήνες)
Συγκεντρωτική απόδοση διακομιστή (RX+TX) 42 Gbps (περιορισμένο σε λογισμικό) 49.8 Gbps (διαδικασία σύνδεσης)
Μικρό πακέτο (64Β) 8.1 Mpps 37.5 Mpps (χειρισμός ροής υλικού)

Οι μηχανικοί σημείωσαν ότι ηMCX631102AN-ADAT Ethernet λύση κάρτας προσαρμογέαΠαρέδωσε προβλέψιμη καθυστέρηση ουράς κατάλληλη για βάσεις δεδομένων αναλύσεων σε πραγματικό χρόνο.αύξηση της συνολικής πυκνότητας ενοικιαστών κατά περίπου 24% στους ίδιους φυσικούς διακομιστές.

Συμβατότητα και ολοκλήρωση οικοσυστήματος

Κατά την επέκταση της ανάπτυξης, η ομάδα επιχειρήσεων επαλήθευσε ότι ο προσαρμογός είναιΣυμφωνία MCX631102AN-ADATΓια τον προγραμματισμό προμηθειών, αναφέρθηκαν στοΔελτίο δεδομένων MCX631102AN-ADATΟι πρώτες μαζικές έρευνες επιβεβαίωσαν ότι ηMCX631102AN-ADAT τιμήπαραμένει ανταγωνιστική σε σύγκριση με τα SmartNIC παρόμοιας κατηγορίας, με πολλούς διανομείς ναMCX631102AN-ADAT προς πώλησηβάσει τυποποιημένων συμφωνιών όγκου.

Περίληψη & Προοπτικές

Η περίπτωση παραγωγής αποδεικνύει σαφώς ότιMCX631102AN-ADATΗ τεχνολογία αυτή επιτρέπει μια θεμελιώδη μετατόπιση από τα δίκτυα αποθήκευσης που συνδέονται με το TCP σε υφάσματα που επιταχύνονται με RDMA χωρίς να απαιτείται πλήρης αναθεώρηση της υποδομής 100GbE.MCX631102AN-ADAT ConnectX-6 Lx διπλής θύρας 25GbE SFP28Η τεχνολογία αυτή θα μπορούσε να βοηθήσει τις επιχειρήσεις να βελτιώσουν την αποτελεσματική απόδοση για ευαίσθητα σε καθυστέρηση φορτία εργασίας, ενώ παράλληλα θα ανακτούν σημαντικούς πόρους CPU.το ίδιο πρότυπο ανάπτυξης θα επεκταθεί σε διανεμημένα πλαίσια μηχανικής μάθησης (NCCL over RoCE) και εφαρμογές που βασίζονται σε μικροεφαρμογέςΓια τους αρχιτέκτονες που αξιολογούν αναβαθμίσεις 25GbE, ηNVIDIA Mellanox MCX631102AN-ADATΑποτελεί ένα αποδεδειγμένο δομικό στοιχείο για δίκτυα κέντρων δεδομένων υψηλής απόδοσης και χαμηλής καθυστέρησης.