Cisco Live : la puce G300 concrétise des réseaux ultrarapides pour l’IA

Capable de router les communications des serveurs de calcul à la vitesse de 102,4 Tbit/s, la dernière puce de Cisco va équiper aussi bien les switches des hyperscalers que ceux des entreprises privées, le constructeur militant désormais pour des IA souveraines.

L’équipementier Cisco profite de son salon européen annuel à Amsterdam, qui se tient cette semaine, pour dévoiler sa nouvelle puce contrôleur Silicone One G300, capable de router 102,4 Tbit d’informations par seconde. Un tel débit est nécessaire en particulier dans les clusters de calcul d’IA équipés de puissants GPU, afin d’éviter que ces composants achetés hors de prix pour leur vitesse ne se tournent les pouces pendant les transferts des données depuis les baies de stockage.

Le G300 devrait arriver dès ce trimestre dans une variété de switches Nexus 9000 (sous NX-OS, le système de Cisco pour les entreprises) et Cisco 8000 (sous le système Open source SONiC, pour les hébergeurs de cloud). Ces switches, dont la référence n’a pas encore été communiquée, devraient notamment proposer, dans un boîtier 2U, 64 ports 1,6 Tbit/s individuellement déclinables en quatre fibres véhiculant 400 Gbit/s chacune. Ou, dans un boîtier offrant 128 ports de 800 Gbit/s chacun.

À cette fin, Cisco lance dans le même temps de nouveaux embouts 1,6T OSFP (4 x 400 Gbit/s) et 800G LPO (1 x 800 Gbit/s) qui convertissent les signaux électriques de chaque port en signaux optiques capables de voyager sur 500 mètres, via des fibres ordinaires. Et, ce, pour une consommation électrique 50% inférieure à la génération précédente d’embouts.

La vitesse de 800 Gbit/s a ceci d’intéressant qu’il s’agit de celle utilisée par les nouvelles cartes réseau BlueField-4 que Nvidia propose sur le marché des clusters de calcul pour l’IA. Ces cartes vont permettre à la prochaine génération de GPU Rubin de communiquer deux fois plus rapidement avec les baies de stockage qui contiennent les données à traiter.

Mais même avec des connexions en 400 Gbit/s, le Silicon One G300 présentera l’intérêt d’équiper des switches deux fois moins volumineux et 1,5 fois plus économes en énergie que les appareils réseau actuels, équipés de Silicon One G200. Ce dernier ne sait router que 51,2 Tbit/s.

Pas encore de packaging photonique

Il est notable que Cisco conserve une architecture classique, dans laquelle les signaux basculent en mode optique uniquement après être sortis des connecteurs QSFP prévus pour des câbles en cuivre.

Ses concurrents Nvidia et Broadcom ont déjà annoncé la génération suivante, dans laquelle le contrôleur est lui-même entouré d’une couronne CPO (Co-Packaged Optics) de convertisseurs électriques/optiques (alias photoniques) sur la carte mère du switch. Selon eux, une telle architecture doit permettre de ne plus avoir que des connecteurs optiques à l’arrière de l’équipement, ce qui évitera de déployer des embouts OSFP forts coûteux aussi bien à l’achat qu’en termes de consommation d’énergie.

« Nous avons nous aussi dans nos cartons de telles couronnes photoniques pour convertir les signaux en optique dès le socle de la puce de contrôle. Mais nous considérons que cela n’est pas encore nécessaire avec des connecteurs qui communiquent jusqu’en 1,6 Tbit/s. Parce qu’il reste plus avantageux de remplacer seulement un embout plutôt que toute la puce de contrôle », explique Satish Surapaneni, directeur des produits réseau pour les prestataires de connectivité (télécoms...). Il ne précise pas s’il fait référence à un éventuel problème de fragilité de ces embouts ou à une question d’agilité dans le choix des configurations.

« Nos derniers embouts OSFP intègrent une nouvelle génération de circuits DSP, gravés plus finement, donc leur consommation ne va pas beaucoup augmenter par rapport à la génération précédente. Quant à leur prix, oui, ils seront certainement deux fois plus chers que des embouts OSFP véhiculant deux fois 400 Gbit/s... si vous comparez les prix actuels. Parce que les embouts de génération précédente valent désormais beaucoup moins cher. Mais si vous comparez avec le prix des embouts de 400 Gbit/s lorsqu’ils sont sortis, vous trouveriez sensiblement la même chose », ajoute-t-il.

Selon lui, placer une couronne CPO autour du contrôleur ne sera sans doute pertinent qu’à partir du moment où le switch aura des connecteurs réseau proposant chacun 3,2 Tbit/s de bande passante. À ce moment-là, il y aura sans doute trop de stress électrique au niveau des embouts pour, par exemple, décliner le signal sur quatre fibres de 800 Gbit/s. Dès que le signal est transformé en optique, le décliner en plusieurs fibres repose sur un minuscule système de prismes plus ou moins passifs qui décomposent les ondes lumineuses.

Satish Surapaneni ne se prononce pas sur une date de disponibilité. Sur les stands du salon Cisco Live, d’autres équipes de Cisco évoquent la possibilité d’un format CPO dès cette année.

Encourager une IA souveraine

Cisco décline désormais ses contrôleurs Silicon One en plusieurs familles. Celle dont la référence commence par un G est dédiée aux switches qui s’interfacent avec des GPU. À l’heure actuelle, la famille Silicon One que Cisco met le plus en avant est néanmoins la déclinaison P, dont le modèle P200 (routage de 51,2 Tbit/s) est sorti en octobre dernier.

« Les switches basés sur des Silicone One P sont ceux qui servent à interconnecter des datacenters d’IA sur de longues distances, éventuellement à des centaines de kilomètres. Cela devient critique, car il est de plus en plus compliqué de construire des datacenters avec suffisamment de puissance électrique pour héberger tout un cluster de serveurs de calcul. Toujours est-il que les communications sur de telles distances nécessitent beaucoup plus de mémoire tampon au niveau du contrôleur, d’où l’intérêt d’avoir différentes familles », précise Satish Surapaneni.

Le point intéressant est que Cisco annonce également cette semaine des switches N9000 pour datacenters privés à base de P200, alors que ce contrôleur n’était jusqu’ici disponible qu’au sein de switches Cisco 8000 pour hyperscalers. « Avec l’arrivée des G300 et P200 dans nos switches N9000, nous mettons à présent les moyens des grands fournisseurs de services d’IA dans les mains d’entreprises privées et de prestataires locaux de calcul », a lancé, sur scène, Jeetu Patel, le directeur Produits de Cisco.

Ce haut dirigeant de Cisco a axé une partie de son discours d’ouverture sur l’intérêt de favoriser le déploiement de solutions souveraines. Comprendre des services d’IA hébergés par des entreprises locales, en guise d’alternative aux hyperscalers. Une approche qui rappelle celle de VMware lors de ses dernières conférences annuelles.

Face à des clients qui abandonnent leurs datacenters et leurs fournisseurs d’infrastructure au profil de ressources louées en cloud chez les hyperscalers, le discours de Cisco et VMware consiste à encourager le déploiement d’infrastructures souveraines, dans lesquelles des entreprises privées doivent de nouveau racheter des produits aux fournisseurs historiques.

Reste à savoir s’il s’agit de la bonne stratégie. Comme lors des événements européens de VMware, des visiteurs de ce Cisco Live n’ont pas manqué de noter que ces louanges pour les infrastructures souveraines reposaient sur des produits américains.

G300 et P200 bénéficient de la même finesse de gravure et font à peu près la même taille, le premier ayant un maximum de cœurs de routage, alors que la surface du second est surtout occupée par de la mémoire cache. Il faudra donc attendre la prochaine génération de finesse de gravure pour voir arriver sur le marché un hypothétique P300 capable de router 102,4 Tbit/s sur les longues distances qui séparent les datacenters d’IA souveraine.

Pour approfondir sur Hardware IA (GPU, FPGA, etc.)