Mellanox (NVIDIA Mellanox) 920-9B210-00FN-0D0 Εφαρμογή Πρακτικής Διακόπτη InfiniBand
January 6, 2026
Πίσωθεν και προκλήσεις: Το εμπόδιο του δικτύου στη σύγχρονη πληροφορική
Στην κούρσα για επιστημονικές ανακαλύψεις και ανακαλύψεις στην τεχνητή νοημοσύνη, οι υπολογιστικές δυνατότητες ενός κορυφαίου ερευνητικού ιδρύματος δεν καταπνίγονταν από έλλειψη πρώτης ισχύος επεξεργασίας,αλλά από το δίκτυο τους.Η υπάρχουσα υποδομή HDR InfiniBand, αν και ικανή, δυσκολευόταν να συμβαδίσει με την τεράστια,Συγχρονισμένες απαιτήσεις επικοινωνίας των νεοεμφανιζόμενων συστάσεων NVIDIA DGX και των παραδοσιακών φορτίων εργασίας HPCΟι ερευνητές αντιμετώπισαν σημαντικές καθυστερήσεις στους χρόνους ολοκλήρωσης των εργασιών, με την καθυστέρηση του δικτύου και την συμφόρηση κατά τη διάρκεια των συστημάτων επικοινωνίας όλων προς όλους να γίνονται το κύριο πρόβλημα.
Η πρόκληση ήταν διπλή: πρώτον, να μειωθεί δραστικά η καθυστέρηση για τις λειτουργίες Remote Direct Memory Access (RDMA) που είναι κρίσιμες για τις προσομοιώσεις HPC που βασίζονται σε MPI.μη αποκλειστικό ύφασμα για εργασίες κατάρτισης τεχνητής νοημοσύνης που απαιτούσαν σταθερό συγχρονισμό παραμέτρων σε εκατοντάδες GPUΤο ίδρυμα χρειαζόταν μια μελλοντική λύση που θα μπορούσε να χειριστεί ταχύτητες NDR 400Gb/s ενώ θα ήταν πλήρωςσυμβατόμε το υπάρχον οικοσύστημα, εξασφαλίζοντας μια οικονομικά αποδοτική πορεία αναβάθμισης χωρίς πλήρη αναμόρφωση.
Λύση και εφαρμογή: Εφαρμογή του υλικού 920-9B210-00FN-0D0
Μετά από διεξοδική αξιολόγηση, το ίδρυμα επέλεξε τοNVIDIA Mellanox 920-9B210-00FN-0D0Η λύση επικεντρώθηκε στην ανάπτυξη πολλαπλών920-9B210-00FN-0D0 MQM9790-NS2F 400Gb/s NDRΟι διακόπτες σχηματίζουν ένα στρώμα σπονδυλικής στήλης υψηλού εύρους ζώνης, χαμηλής καθυστέρησης, που συνδέει όλους τους υπολογιστικούς και αποθηκευτικούς κόμβους.
Η ανάπτυξη ήταν δομημένη ως υβριδική τοπολογία δύο επιπέδων λιπαρού δέντρου για τη μεγιστοποίηση του bisectional εύρους ζώνης και την ελαχιστοποίηση του αριθμού hop.
- Κέντρο υφάσματος:Ένα στρώμα σπονδυλικής στήλης που είναι κατασκευασμένο εξ ολοκλήρου με920-9B210-00FN-0D0διακόπτες, που παρέχουν το NDR 400Gb/s.
- Συμπλήρωση χωρίς αποκλίσεις:Εκμεταλλευόμενοι την αναδρομική συμβατότητα του διακόπτη, συνδέθηκαν οι υπάρχοντες διακόπτες φύλλου HDR και οι NIC, προστατεύοντας προηγούμενες επενδύσεις ενώ επέτρεπαν πρόσθετες αναβαθμίσεις κόμβων σε NDR.
- Προχωρημένη Διαχείριση:Όλο το ύφασμα, συμπεριλαμβανομένου του νέου920-9B210-00FN-0D0 InfiniBand διακόπτης OPNΗ διαχείριση των μονάδων, πραγματοποιήθηκε κάτω από ένα ενιαίο γυάλινο πάνελ χρησιμοποιώντας το NVIDIA UFM®, επιτρέποντας ακριβή τηλεμετρία απόδοσης, αυτοματοποιημένη προμήθεια υφασμάτων και γρήγορη απομόνωση σφαλμάτων.
- Πιστοποίηση:Η ομάδα πληροφορικής συμβουλεύτηκε αυστηρά τον αξιωματούχοΠίνακας δεδομένων 920-9B210-00FN-0D0καιπροδιαγραφέςνα επικυρώνουν τις απαιτήσεις εμβέλειας καλωδίων, ισχύος και ψύξης στο κέντρο δεδομένων τους, εξασφαλίζοντας βέλτιστη απόδοση.
Αυτή η αρχιτεκτονική καθιέρωσε ένα ενιαίο920-9B210-00FN-0D0 Λύση InfiniBand switch OPN, εξυπηρετώντας τόσο τα κλασικά φορτία εργασίας HPC του ιδρύματος όσο και τα αναδυόμενα φορτία εργασίας AI σε ένα ενιαίο, ισχυρό δίκτυο.
Επιπτώσεις και οφέλη: ποσοτικοποιήσιμα κέρδη στην απόδοση και την αποτελεσματικότητα
Η επίδραση της ανάπτυξης του920-9B210-00FN-0D0Η εταιρεία έχει ήδη αναπτύξει μια νέα τεχνολογία, η οποία είναι άμεσα μετρήσιμη και μετασχηματιστική σε πολλές διαστάσεις των δραστηριοτήτων τους.
| Μετρική | Πριν Αποστολή | Μετά την 920-9B210-00FN-0D0 Εγκατάσταση |
|---|---|---|
| Μέση MPI καθυστέρηση (πίσω-πίσω) | ~ 0,7 μικροδευτερόλεπτα | ~0,5 μικροδευτερόλεπτα |
| Χρόνος ολοκλήρωσης εργασίας κατάρτισης τεχνητής νοημοσύνης (μεγάλο μοντέλο) | 5.2 ημέρες | 3.8 ημέρες(27% μείωση) |
| Χρήση υφασμάτων κατά την περίοδο αιχμής | Συχνά υπερβαίνει το 85%, προκαλώντας συμφόρηση | Σταθερό κάτω του 60% στις ταχύτητες NDR |
| Διοικητικά καθήκοντα (αναδιαμόρφωση εργοστασίου) | Εγχειριτικές, χρονοβόρες διαδικασίες | Αυτοματοποιημένη μέσω της ολοκλήρωσης UFM® |
Το σημαντικότερο όφελος ήταν η δραματική μείωση του χρόνου εκτέλεσης των εφαρμογών.παρατηρήθηκε βελτίωση κατά 20-30% λόγω χαμηλότερης και πιο σταθερής καθυστέρησης MPIΓια τις ομάδες τεχνητής νοημοσύνης, η σχεδόν θεωρητική απόδοση του RDMA πάνω στο νέο υλικό σήμαινε ότι οι πόροι της GPU ήταν πλήρως κορεσμένοι με υπολογισμούς, όχι στασιμότητα περιμένοντας για μεταφορές δικτύου.Κατά την αξιολόγηση του συνολικού920-9B210-00FN-0D0 τιμήΗ εν λόγω αύξηση των ερευνητικών αποτελεσμάτων επέφερε μια συναρπαστική απόδοση επένδυσης, η οποία υπερέβαινε κατά πολύ τις αρχικές κεφαλαιακές δαπάνες.
Συμπεράσματα και προοπτικές: Σχέδιο για υποδομές μελλοντικής ανάπτυξης
Η επιτυχής εφαρμογή τηςNVIDIA Mellanox 920-9B210-00FN-0D0Η διασύνδεση μεταξύ των ερευνητικών ερευνητών αποτελεί ένα ισχυρό σχέδιο για κάθε οργανισμό που αντιμετωπίζει παρόμοιες προκλήσεις.Αποδεικνύει ότι η επένδυση σε ένα προηγμένο δίκτυο δεν αποτελεί συμπληρωματικό κόστος, αλλά ένα στρατηγικό πολλαπλασιαστή για τις επενδύσεις υπολογιστών.
Η ανάπτυξη του ιδρύματος αποδεικνύει ότι η920-9B210-00FN-0D0είναι κάτι παραπάνω από ένα απλό διακόπτη, είναι μια πλατφόρμα που επιτρέπει τη σύγκλιση.απλούστευση των εργασιών και επιτάχυνση της ανακάλυψηςΚαθώς αυτή η τεχνολογία γίνεται ευρύτερα διαθέσιμηπρος πώληση, θέτει ένα νέο πρότυπο για το τι είναι δυνατό σε ομάδες υψηλών επιδόσεων.
Αναφορικά με το μέλλον, η εγγενής κλιμακωτότητα και η απόδοση του NDR 400Gb / s fabric σημαίνει ότι το ίδρυμα είναι σε καλή θέση να ενσωματώσει ακόμη πιο ισχυρούς υπολογιστικούς πόρους στο μέλλον.Η920-9B210-00FN-0D0έχει καταργήσει αποτελεσματικά το δίκτυο ως ένα μπουκάλιο, επιτρέποντας στους ερευνητές να επικεντρωθούν αποκλειστικά στα όρια των αλγορίθμων και της φαντασίας τους.

