Réseau : Arista et Cisco lancent des switches avec connecteurs 800 Gbit/s
Conçus pour équiper les clusters d’entraînement de l’IA, les nouveaux équipements des deux constructeurs ont chacun une approche particulière : plus de fonctions chez Arista et une compatibilité Nvidia Spectrum-X chez Cisco.
Les équipementiers Arista et Cisco lancent tous deux des nouveaux modèles de switches dédiés aux grands clusters d'IA et dont la caractéristique principale est un nombre élevé de connecteurs Ethernet en 800 Gbit/s. Dans sa nouvelle génération R4, Arista met en avant le chiffrement des ports par TunnelSec, ainsi que la présence d’un port HyperPort capable de transférer 3,2 Tbit/s vers un site distant. Cisco, lui, ajoute à son catalogue un switch N9100 directement compatible avec le protocole Spectrum-X dont Nvidia avait jusqu’ici l’exclusivité.
576 connecteurs 800 Gbit/s sur 32U
Dans le détail, la génération R4 d'Arista se compose de deux familles de switches. La famille 7800R4 correspond à des switches 2U de 36 connecteurs 800 Gbit/s assemblés en plus ou moins grande quantité dans un châssis qui leur fournit l’électricité et permet de les administrer ensemble. Quatre tailles sont proposées, de 144 ports sur 10U pour le plus petit cluster, à 576 ports sur 32U pour le plus grand. Ce dernier fait furieusement penser au switch 16800H de Huawei qui, lui, offre 640 ports Ethernet 800 Gbit/s.
La famille 7280R4 correspond pour sa part à des switches 2U autonomes comprenant chacun 32 connecteurs 800 Gbit/s. Il en existe deux modèles, le 32PE et le 32DE, dont la seule différence réside dans le type de connecteur : le premier accepte des embouts optiques OSFP et le second des embouts optiques SQFF-DD. Arista entend vendre sous la même référence un modèle 7280R4-64QC, mais sa connectique est très différente : elle se compose de 64 ports 100 Gbit/s plus 10 ports de 800 Gbit/s. La seule vocation de ces derniers qu’ils soient considérés comme 80 ports virtuels en 100 Gbit/s.
Tous les systèmes d’Arista fonctionnent sous son système d’exploitation EOS et prennent en charge les protocoles EVPN/VXLAN, ainsi que les fonctions WAN classiques (MPLS, SR/SRv6). Selon le constructeur, l'objectif est de créer un réseau avec des latences prévisibles, même en cas de pic de charge comme lors du trafic de type All-Reduce que l’on rencontre dans l’entraînement d’une IA.
Un switch Nvidia avec une marque Cisco
Le switch N9100 de Cisco est plus compact, puisqu’il offre 64 connecteurs 800 Gbit/s dans un boîtier de seulement 2U. Le constructeur le positionne comme un clone du switch SN5600 de Nvidia, avec l’avantage supplémentaire de pouvoir être administrable depuis la console Nexus du constructeur.
Plus précisément, ce switch ne contient même pas la puce contrôleur Silicon One caractéristique des équipements Cisco, mais bien la puce Spectrum-4 du modèle d’origine, fabriquée par Nvidia. Le N9100 est pour ainsi dire un matériel Nvidia vendu en marque blanche par Cisco. Ce dernier y a néanmoins ajouté un système d’exploitation de son cru. Il s’agit au choix de son OS NX-OS ou de sa version du système Open source SONiC.
Pour mémoire, le protocole Spectrum-X est une évolution du protocole RoCE, qui est lui-même une évolution du protocole Ethernet. RoCE ajoute la possibilité d’envoyer des paquets en rafale sur le réseau, sans perte, afin que les données transférées puissent directement être chargées dans la mémoire de la cible (typiquement un GPU), sans passer par de longues étapes de décodage. Spectrum-X ajoute la faculté de sonder en amont le trafic sur les liens réseau pour identifier le chemin le plus fluide. Spectrum-X est une technologie propriétaire de Nvidia. Ses concurrents poussent plutôt la technologie Ultra Ethernet, qui est similaire, mais standard.
