Mellanox (NVIDIA) 920-9B110-00FH-0D0 Εφαρμογή Πρακτικής Διακόπτη InfiniBand

January 5, 2026

τα τελευταία νέα της εταιρείας για Mellanox (NVIDIA) 920-9B110-00FH-0D0 Εφαρμογή Πρακτικής Διακόπτη InfiniBand


Προηγούμενο & Προκλήσεις: Το μεικτό σημείο του δικτύου σε ένα κέντρο έρευνας πολυ-μοδαλικής τεχνητής νοημοσύνης

Ένα κορυφαίο κέντρο ερευνών AI πολλαπλών τρόπων, το έργο του οποίου καλύπτει την εκπαίδευση μεγάλων μοντέλων γλώσσας, τις επιστημονικές προσομοιώσεις υπολογιστών και την ανάπτυξη αυτόνομων συστημάτων, αντιμετώπιζε ένα κρίσιμο τείχος κλιμακωτότητας.Το υφιστάμενο υλικό Ethernet 100Gb / s τους αγωνίστηκε κάτω από την έντονηΟι βασικές προκλήσεις ήταν τρεις: απρόβλεπτοι χρόνοι ολοκλήρωσης εργασίας λόγω της συμφόρησης του δικτύου,αναποτελεσματική χρήση GPU συχνά κάτω από 60%Η ανάγκη για ένα καθοριστικό, υπερ-χαμηλής καθυστέρησης υλικό ήταν πρωταρχική.

Λύση και ανάπτυξη: Αρχιτεκτονική με το 920-9B110-00FH-0D0 InfiniBand Switch OPN

Οι μηχανικοί του κέντρου σχεδίασαν μια νέα σπονδυλική στήλη ομάδας με επίκεντρο το ** NVIDIA Mellanox 920-9B110-00FH-0D0**.Χρησιμοποιώντας αυτούς τους διακόπτες τόσο ως φύλλα και σπονδυλικούς κόμβουςΟ **920-9B110-00FH-0D0 MQM8790-HS2F 200Gb/s HDR** πυρήνας παρείχε το απαραίτητο αμφίδρομο εύρος ζώνης και πυκνότητα θύρας για τη διασυνδέση πάνω από 1.000 GPU NVIDIA A100 και H100 απρόσκοπτα.

Οι βασικές αποφάσεις ανάπτυξης περιλάμβαναν:

  • Ίδρυμα υφάσματος:Η τυποποίηση στο **920-9B110-00FH-0D0** εξασφάλισε ένα ομοιογενές ύφασμα υψηλών επιδόσεων, απλοποιώντας τη διαχείριση και την αντιμετώπιση προβλημάτων.
  • Ενεργοποίηση υπολογιστών στο δίκτυο:Το προσβαλλόμενο πρωτόκολλο ιεραρχικής συγκέντρωσης και μείωσης (Scalable Hierarchical Aggregation and Reduction Protocol) (SHARP) TM της NVIDIA ενεργοποιήθηκε σε ολόκληρο το υλικό, αποφορτώνοντας συλλογικές λειτουργίες (όπως το All-Reduce) από την CPU στο δίκτυο διακόπτη.
  • RDMA από άκρο σε άκρο:Το **920-9B110-00FH-0D0 συμβατό** οικοσύστημα, συμπεριλαμβανομένων των προσαρμογών ConnectX-7, επέτρεψε μια αληθινή διαδρομή RDMA (Remote Direct Memory Access) από άκρο σε άκρο,παράκαμψη του λειτουργικού συστήματος και των CPU για την κίνηση δεδομένων.
  • Ευφυής Διαχείριση:Το υλικό διαχειρίστηκε από την NVIDIA UFM®, παρέχοντας βαθιά τηλεμετρία και γνώσεις που βασίζονται στην τεχνητή νοημοσύνη για προληπτική παρακολούθηση της υγείας και βελτιστοποίηση της απόδοσης.

Αποτελέσματα και οφέλη: ποσοτικοποιήσιμα κέρδη στην απόδοση και την αποτελεσματικότητα

Η ανάπτυξη της λύσης **920-9B110-00FH-0D0 InfiniBand switch OPN** έφερε μετασχηματιστικά αποτελέσματα, αντιμετωπίζοντας άμεσα τις αρχικές προκλήσεις.Οι μετρήσεις απόδοσης καταγράφηκαν πριν και μετά τη μετανάστευση.

Μετρική Προηγούμενο Δίκτυο Με υφάσματα 920-9B110-00FH-0D0 Βελτίωση
Μέση χρήση GPU ~ 58% ~92% +59%
Όλο-μείωση της καθυστέρησης (4KB) 15 μs 5 μs 67% μείωση
Χρόνος εκπαίδευσης μεγάλου μοντέλου (παράδειγμα αναφοράς) Αρχική τιμή (100%) 41% της αρχικής τιμής 2.4 φορές πιο γρήγορα
Οροφή κλιμακωτότητας ομάδας 256 κόμβοι 1024+ κόμβοι (επιβεβαιωμένοι) 4x+ κλίμακα

Τα οφέλη επεκτάθηκαν πέρα από την ωμή ταχύτητα. Η λειτουργική αποτελεσματικότητα βελτιώθηκε λόγω των προβλέψιμων χρόνων ολοκλήρωσης των εργασιών. Οι ερευνητές μπορούσαν τώρα να ξεκινήσουν μεγαλύτερα, πιο περίπλοκα πειράματα με αυτοπεποίθηση,επιτάχυνση του ρυθμού της καινοτομίαςΟι αξιόπιστες προδιαγραφές **920-9B110-00FH-0D0**, που περιγράφονται λεπτομερώς στο επίσημο δελτίο δεδομένων, παρείχαν την εμπιστοσύνη της μηχανικής που απαιτείται για αυτή την αποστολή.

Συμπέρασμα & Προοπτικές για το μέλλον

Η παρούσα περίπτωση εφαρμογής αποδεικνύει σαφώς ότι το **Mellanox (NVIDIA) 920-9B110-00FH-0D0** είναι πολύ περισσότερο από ένα απλό στοιχείο μεταγωγής.είναι ένας υπολογιστικός παράγοντας για τη σύγχρονη υποδομή AI και HPCΠαρέχοντας καθοριστική χαμηλή καθυστέρηση, αξιοποιώντας υπολογιστές στο δίκτυο και επιτρέποντας απρόσκοπτη RDMA, μετατρέπει την απόδοση των cluster από ένα μπουκάλιο σε ανταγωνιστικό πλεονέκτημα.

Η επιτυχία αυτής της ανάπτυξης υπογραμμίζει την αξία της ολοκληρωμένης λύσης **920-9B110-00FH-0D0 InfiniBand switch OPN**.Οι αρχιτεκτονικές αρχές που επιτρέπονται από αυτή την αλλαγή θα γίνουν το de facto πρότυποΓια οργανισμούς που αξιολογούν το **920-9B110-00FH-0D0 προς πώληση** και την τιμή του **920-9B110-00FH-0D0** έναντι του συνολικού κόστους ιδιοκτησίας,Αυτή η υπόθεση παρέχει ένα πειστικό επιχείρημα για επένδυση σε ένα δίκτυο που απελευθερώνει το πλήρες δυναμικό κάθε δολαρίου υπολογιστών που δαπανάται.