Τεχνική Λευκή Βίβλος: Λύση Διακόπτη InfiniBand NVIDIA Mellanox 920-9B210-00FN-0D0
January 6, 2026
Η εξέλιξη των υπολογιστικών φόρτων εργασίας προς την εκπαίδευση της τεχνητής νοημοσύνης σε έκτακτη κλίμακα και τις προσομοιώσεις HPC υψηλής πιστότητας έχει μετατοπίσει θεμελιωδώς το μπουκάλιο απόδοσης από την υπολογιστική προς τη διασύνδεση.Τα σύγχρονα RDMA-εξαρτώμενα clusters απαιτούν ένα υλικό που παρέχει όχι μόνο υψηλό εύρος ζώνης αλλά και καθοριστική εξαιρετικά χαμηλή καθυστέρησηΤα παλιά δίκτυα συχνά εισάγουν μεταβλητή καθυστέρηση, απώλεια πακέτων που προκαλείται από συμφόρηση και πολυπλοκότητα διαχείρισης,που μεταφράζονται άμεσα σε μεγαλύτερο χρόνο λύσης, ανεπαρκώς αξιοποιημένοι πόροι GPU/CPU και αυξημένα λειτουργικά έξοδα.
Η τεχνική αυτή λύση αντιμετωπίζει τις βασικές απαιτήσεις για τα κέντρα δεδομένων και τις ερευνητικές εγκαταστάσεις επόμενης γενιάς:υφάσματα υψηλών επιδόσεων που είναι ικανά να συγκλίνουν κλασικά φορτία εργασίας HPC (βασισμένα σε MPI) και σύγχρονη τεχνητή νοημοσύνη (συλλογική επικοινωνία)Οι βασικές τεχνικές απαιτήσεις περιλαμβάνουν καθυστέρηση διακόπτη κάτω των μικροδευτερολέπτων, μη αποκλειστική απόδοση για τα πρότυπα επικοινωνίας "όλα προς όλα", έξυπνο έλεγχο συμφόρησης,και ένα πλαίσιο διαχείρισης που παρέχει βαθιά ορατότητα και αυτοματοποίηση. το920-9B210-00FN-0D0 Λύση InfiniBand switch OPNΕίναι σχεδιασμένο για να ανταποκρίνεται σε αυτά τα αυστηρά πρότυπα.
Η προτεινόμενη αρχιτεκτονική είναι ένα υλικό σπονδυλικής στήλης που έχει σχεδιαστεί για μέγιστο bisectional εύρος ζώνης και κλιμακωτότητα, που βασίζεται στην τεχνολογία NDR 400Gb / s InfiniBand.NVIDIA Mellanox 920-9B210-00FN-0D0Το στρώμα φύλλου μπορεί να αποτελείται από ένα μείγμα NDR ή HDR διακόπτες, που συνδέουν κόμβους υπολογισμού (GPU διακομιστές όπως συστήματα NVIDIA DGX, συστάδες CPU),Υψηλής απόδοσης παράλληλη αποθήκευση (NVMe-oF), και τους κόμβους διαχείρισης.
Αυτό το αποσυνδεδεμένο σχεδιασμό εξασφαλίζει προβλέψιμη καθυστέρηση και εξαλείφει την υπερ-υπογραφή εντός του υλικού.
- Εναλλακτικά υφάσματα:Ένα ενιαίο δίκτυο για την επεξεργασία δεδομένων (Ανατολικός-Δυτικός) και την κυκλοφορία αποθήκευσης, που απλοποιεί τη διαχείριση και μειώνει το CAPEX.
- Χωρίς απώλειες:Εκμετάλλευση του εγγενούς ελέγχου συμφόρησης και διαχείρισης ροής κυκλοφορίας του InfiniBand για να εξασφαλιστεί μηδενική απώλεια πακέτων, η οποία είναι κρίσιμη για την απόδοση RDMA και MPI.
- Δίκτυα που καθορίζονται από λογισμικό:Η ενσωμάτωση με το NVIDIA Cumulus Linux και την πλατφόρμα UFM® επιτρέπει προγραμματισμό αυτοματισμού υφασμάτων και διαχείριση με βάση τις πολιτικές.
Η920-9B210-00FN-0D0 MQM9790-NS2F 400Gb/s NDRΟ διακόπτης είναι ο στρατηγικός ακρογωνιαίος λίθος αυτής της αρχιτεκτονικής, ενεργώντας ως η σπονδυλική στήλη υψηλών επιδόσεων.
Τα βασικά τεχνικά χαρακτηριστικά του, όπως περιγράφονται λεπτομερώς στο επίσημο έγγραφοΠίνακας δεδομένων 920-9B210-00FN-0D0, απευθείας για τη βελτιστοποίηση χαμηλής καθυστέρησης:
- Μετακόμιση διακοπής και υπερ-χαμηλή καθυστέρηση:Ο διακόπτης χρησιμοποιεί προηγμένη αρχιτεκτονική διακόπτη, επιτυγχάνοντας καθυστέρηση από θύρα σε θύρα κάτω από 100 νανοδευτερόλεπτα..
- NDR 400Gb/s εύρος ζώνης:Κάθε θύρα παρέχει 400Gb / s, παρέχοντας το απαραίτητο χώρο για την πρόληψη της συμφόρησης κατά τη διάρκεια κορυφαίων φόρτων εργασίας, όπως τα κατανεμημένα σημεία ελέγχου εκπαίδευσης τεχνητής νοημοσύνης ή τις εκτεταμένες λειτουργίες MPI_allreduce.
- Προσαρμοστική διαδρομή και έλεγχος συμφόρησης:Η τεχνολογία SHARP (Scalable Hierarchical Aggregation and Reduction Protocol) v3 της NVIDIA, ενσωματωμένη στον διακόπτη, αποφορτίζει τις συλλογικές λειτουργίες από την CPU,μειώνει δραστικά τα έξοδα συγχρονισμούΣε συνδυασμό με τη δυναμική προσαρμοστική δρομολόγηση, αποτρέπει τα καυτά σημεία και εξασφαλίζει ισορροπημένη χρήση υφασμάτων.
- Πίσω και εμπρός συμβατότητα:Η αλλαγή αποτελεί αναπόσπαστο μέρος μιας ομαλής στρατηγικής μετανάστευσης.συμβατόΗ εν λόγω εφαρμογή θα πρέπει να είναι δυνατή με βάση την τεχνολογία HDR (200Gb/s) και EDR (100Gb/s) που διαθέτει η ΕΕ.920-9B210-00FN-0D0 προδιαγραφέςείναι ζωτικής σημασίας για τον σχεδιασμό της συνδεσιμότητας των λιμένων και των τύπων καλωδίων.
Η αρχική ανάπτυξη θα πρέπει να ακολουθεί μια αρθρωτή προσέγγιση "pod".920-9B210-00FN-0D0Οι διακόπτες σε έναν ρόλο σπονδυλικής στήλης για εφεδρικότητα, συνδεδεμένοι με πολλαπλούς διακόπτες HDR ή NDR που υποστηρίζουν αρκετές δεκάδες κόμβους υπολογισμού.
Συνιστώμενη τοπολογία για βέλτιστη απόδοση:Δύο επίπεδα μη αποκλειστικής τοπολογίας Clos (Fat-Tree).Ο αριθμός των σπονδυλικών διακόπτες (920-9B210-00FN-0D0 μονάδες) καθορίζεται από τον αριθμό των αναβαθμισμένων συνδέσεων από κάθε διακόπτη φύλλου και το επιθυμητό ποσοστό υπεραγραφής (ιδανικά 11 για την HPC/AI).
- Μεγέθυνση:Για να κλιμακώσετε το σύμπλεγμα, προσθέστε περισσότερους διακόπτες φύλλων και αναλογικά προσθέστε περισσότερα920-9B210-00FN-0D0Το ύφασμα απευθύνεται και ο δρόμος κλιμακώνεται απρόσκοπτα υπό τη διαχείριση UFM®.
- Μεγέθυνση:Οι μεμονωμένοι κόμβοι μπορούν να αναβαθμιστούν σε NDR NICs, αξιοποιώντας αμέσως το πλήρες εύρος ζώνης 400Gb / s στην σπονδυλική στήλη.συμβατόΗ φύση υποστηρίζει αυτό το ετερογενές περιβάλλον.
- Καλωδίωση και ρεύμα:Ο σχεδιασμός της εγκατάστασης πρέπει να λαμβάνει υπόψη τα οπτικά καλώδια συμβατά με το NDR (π.χ. OSFP).920-9B210-00FN-0D0 προδιαγραφέςνα παρέχει ακριβή κατανάλωση ενέργειας και θερμικά δεδομένα για ακριβή σχεδιασμό ισχύος και ψύξης κέντρου δεδομένων.
Όταν αυτή η λύση είναι διαθέσιμηπρος πώληση, η συνεργασία με πιστοποιημένους εταίρους συνιστάται για το μοντέλο της σωστής920-9B210-00FN-0D0 τιμήκαι ποσότητα για το συγκεκριμένο σχέδιο κλιμάκωσης.
Η λειτουργική αριστεία επιτυγχάνεται μέσω της πλατφόρμας NVIDIA UFM®.920-9B210-00FN-0D0Κάντε αλλαγή.
- Προληπτική παρακολούθηση:Το UFM® προσφέρει τηλεμετρία σε πραγματικό χρόνο για την κατάσταση των διακόπτες, την αξιοποίηση των θύρων, τη θερμοκρασία, τους μετρητές σφαλμάτων και την εμπεριστατωμένη ανάλυση των προτύπων κυκλοφορίας σε επίπεδο εφαρμογής,συμπεριλαμβανομένων των μήτρων επικοινωνίας MPI και RDMA.
- Αυτοματοποιημένη διαχείριση υφασμάτων:Από την αρχική προμήθεια και την επικύρωση καλωδίων έως τις ενημερώσεις firmware και τα αντίγραφα ασφαλείας διαμόρφωσης, το UFM® αυτοματοποιεί τις συνήθεις εργασίες, μειώνοντας το ανθρώπινο σφάλμα και το λειτουργικό κόστος.
- Επεξεργασία προβλημάτων:Τα προηγμένα εργαλεία μπορούν να εντοπίσουν τις ανωμαλίες απόδοσης, να εντοπίσουν τις ροές που δεν συμπεριφέρονται σωστά και προκαλούν συμφόρηση και να οραματίσουν την τοπολογία του υλικού για να απομονώσουν γρήγορα τους αποτυχημένους συνδέσμους ή τα εξαρτήματα.
- Συνεχή βελτιστοποίηση:Εκμεταλλευτείτε τις γνώσεις UFM® σε σωστό μέγεθος φορτίων εργασίας, επικυρώστε ότι η απόδοση ευθυγραμμίζεται μεφύλλο δεδομένωνΗ τακτική αναθεώρηση των μετρήσεων συμφόρησης και καθυστέρησης είναι το κλειδί για τη διατήρηση των μέγιστων επιδόσεων των υφασμάτων.
Εφαρμογή μιας αρχιτεκτονικής υφασμάτων με επίκεντρο τηνNVIDIA Mellanox 920-9B210-00FN-0D0Ο διακόπτης InfiniBand παρέχει ένα θεμελιώδες ανταγωνιστικό πλεονέκτημα για οργανισμούς που εξαρτώνται από υπολογιστές υψηλής απόδοσης.Αυτή η τεχνική λύση προσφέρει ποσοτικοποιήσιμη αξία σε πολλές διαστάσεις:
| Διάσταση αξίας | Κατανοητό αποτέλεσμα |
|---|---|
| Τεχνική απόδοση | Διοριστική καθυστέρηση υπομικροδευτερολέπτου, μη αποκλειστικό εύρος ζώνης 400Gb/s και λειτουργία χωρίς συμφόρηση για RDMA και MPI. |
| Επιτάχυνση των επιχειρήσεων/ερευνών | Μείωση των χρόνων εκτέλεσης των εφαρμογών κατά 20-40%, επιτάχυνση του χρόνου ανακάλυψης και των κύκλων ανάπτυξης προϊόντων. |
| Λειτουργική αποτελεσματικότητα | Η ενιαία διαχείριση, η αυτοματοποιημένη προμήθεια και η βαθιά τηλεμετρία μειώνουν το συνολικό κόστος παραγωγής και ελαχιστοποιούν τον χρόνο διακοπής. |
| Προστασία των επενδύσεων | Η συμβατότητα προς τα πίσω και η κλιμακώσιμη αρχιτεκτονική προστατεύουν τις υφιστάμενες επενδύσεις, παρέχοντας παράλληλα σαφή πορεία προς τις μελλοντικές τεχνολογίες. |
Συνοπτικά, η920-9B210-00FN-0D0δεν είναι απλώς ένα συστατικό στοιχείο, αλλά ο παράγοντας που επιτρέπει μια υψηλής απόδοσης, συγκλίνουσα υποδομή.Μεταμορφώνει το δίκτυο από μια δυνητική υποχρέωση σε ένα στρατηγικό περιουσιακό στοιχείο που απελευθερώνει πλήρως τη δύναμη των σύγχρονων υπολογιστικών ομάδων..

