Cisco UCS C880A M8 HGX B300 NVL8 270GB Refroidi par air (8) Intel Granite Rapids (2) Serveur GPU avec cartes graphiques IA
Énoncé de valeur
Le Cisco UCS C880A M8 accélère les charges de travail avancées d’IA et de calcul haute performance (HPC) dans chaque centre de données grâce aux GPU NVIDIA HGX B300 NVL8 de nouvelle génération.
Vue avant de l’UCS C880A M8
Vue arrière de l’UCS C880A M8
Basé sur la plateforme NVIDIA HGX, le serveur rack Cisco UCS C880A M8 est un serveur rack haute densité refroidi par air, conçu pour alimenter les charges de travail les plus exigeantes en matière d’intelligence artificielle (IA) et de calcul haute performance (HPC). Il intègre la plateforme NVIDIA HGX avec huit GPU NVIDIA HGX B300 (SXM) et est alimenté par deux processeurs Intel® Xeon® de 6e génération, ce qui le rend idéal pour l’inférence en temps réel des grands modèles de langage (LLM), les performances de formation de nouvelle génération et le traitement de données à grand volume. Le C880A M8 prend en charge les clients sur l’ensemble de la pile d’IA, de la formation et du réglage fin de modèles à grande échelle à l’inférence en temps réel et au traitement de données à grand volume. Il s’intègre parfaitement dans la stratégie d’IA de Cisco, connectant et protégeant l’ère de l’IA en fournissant une infrastructure de calcul robuste. Ce serveur étend le portefeuille de serveurs d’IA denses Cisco UCS®, offrant une solution puissante pour les entreprises de divers secteurs, y compris les fournisseurs de services, les services financiers, la fabrication, la santé, les sciences de la vie et l’automobile. Grâce à son architecture avancée, le C880A M8 garantit des performances, une évolutivité et une gérabilité d’entreprise inégalées, ce qui le rend idéal pour les cas d’utilisation d’IA à forte intensité de calcul, tels que la formation de modèles d’IA à grande échelle, le réglage fin et l’inférence.
Caractéristiques principales
Libérer le potentiel de l’IA avec NVIDIA HGX B300
Le serveur rack Cisco UCS C880A M8 se distingue par l’intégration de la plateforme NVIDIA HGX de pointe avec huit GPU NVIDIA B300 (SXM). Cette puissante configuration de GPU est au cœur de sa capacité à offrir des performances de niveau supérieur pour les charges de travail d’IA les plus exigeantes, y compris la formation de modèles d’IA à grande échelle, le réglage fin et l’inférence en temps réel. Les GPU B300 offrent d’immenses capacités de traitement parallèle et des interconnexions GPU à haute vitesse, qui sont essentielles pour accélérer les modèles d’apprentissage profond complexes et les grands modèles de langage. Cette intégration garantit que les entreprises peuvent atteindre un débit de jetons plus élevé et améliorer l’économie de leurs opérations d’IA, permettant une mise à l’échelle rentable des LLM et des charges de travail d’agents.
Gérabilité complète de l’IA d’entreprise
Le serveur rack Cisco UCS C880A M8 est conçu pour être prêt pour l’entreprise. Dans une version future, le C880A M8 permettra la gestion via Cisco Intersight.
Cisco Intersight fournit une plateforme de gestion basée sur le cloud qui simplifie la gestion du cycle de vie des serveurs, offrant des capacités telles que les opérations d’alimentation, des mesures de surveillance étendues, la gestion de la configuration des serveurs et la gestion de la publication des bundles de micrologiciels. Ce contrôle et cette observabilité centralisés rationalisent les opérations de l’infrastructure d’IA, réduisent la complexité et garantissent une application cohérente des politiques dans le centre de données.
Conçu spécifiquement pour les charges de travail d’IA et de HPC
Au-delà de la puissance brute, le serveur rack Cisco UCS C880A M8 est conçu spécifiquement pour répondre aux exigences uniques de l’IA et du HPC. Sa conception prend en charge l’inférence de grands modèles de langage en temps réel, permettant un déploiement rapide et une réactivité pour les applications basées sur l’IA. Il excelle également dans les performances de formation de nouvelle génération, réduisant considérablement le temps nécessaire à la formation de modèles d’IA complexes. En outre, sa capacité de traitement de données à grand volume en fait une plateforme idéale pour la science des données et l’analyse de mégadonnées, y compris les processus ETL accélérés par GPU. Cette conception spécialisée garantit que les organisations peuvent construire, optimiser et utiliser efficacement les modèles d’IA, accélérant ainsi la croissance de l’entreprise avec des solutions évolutives et hautes performances.
Prise en charge de la plateforme
Le Cisco UCS C880A M8 est une plateforme de serveur rack dédiée conçue pour héberger et accélérer les charges de travail d’IA et de HPC. Il prend en charge divers systèmes d’exploitation et plateformes de virtualisation généralement utilisés dans les environnements de centres de données pour les déploiements d’IA/HPC. La compatibilité de la pile logicielle spécifique inclut NVIDIA AI Enterprise et NVIDIA NIM (NVIDIA Inference Microservices) pour le déploiement et l’optimisation des applications d’IA.
Caractéristiques et avantages
Tableau 1. Résumé des caractéristiques et avantages du serveur rack Cisco UCS C880A M8
|
Caractéristique |
Avantage |
|
NVIDIA HGX avec 8 GPU NVIDIA B300 (SXM) |
Exploite les GPU de supercalcul phares de NVIDIA pour offrir une puissance de traitement inégalée, essentielle pour accélérer la formation, le réglage fin et l’inférence des modèles d’IA |
|
Deux processeurs Intel Xeon de 6e génération |
CPU haute fréquence et haut débit optimisés pour compléter l’accélération GPU, idéal pour alimenter les pipelines de formation et d’inférence sans goulots d’étranglement |
|
NIC NVIDIA ConnectX-8 intégrés à la carte (trafic E/W) |
Le tissu de mise en réseau est-ouest 800G intégré offre une latence ultra-faible et une communication inter-GPU et inter-serveurs à bande passante élevée pour une formation d’IA évolutive |
|
Jusqu’à 8 SSD NVMe E1.S |
Le stockage NVMe local haute performance offre une mise en cache de données à latence ultra-faible et un contrôle rapide des points de contrôle pour la formation de modèles d’IA. |
|
Alimentations redondantes remplaçables à chaud |
Résilience de classe entreprise avec des alimentations redondantes et facilement réparables, conçues pour minimiser les temps d’arrêt et maximiser la disponibilité |
|
Inférence en temps réel des grands modèles de langage (LLM) |
Permet un déploiement rapide et efficace des LLM, prenant en charge les applications et services en temps réel qui nécessitent des réponses immédiates |
|
Performances de formation de nouvelle génération |
Réduit considérablement le temps nécessaire à la formation de modèles d’IA volumineux et complexes, permettant des cycles d’itération et de développement plus rapides |
|
Traitement de données à grand volume |
Conçu pour gérer des ensembles de données massifs, facilitant les processus ETL accélérés et l’analyse de mégadonnées accélérée par GPU |
|
Futures versions : gérabilité de l’IA d’entreprise avec Cisco Intersight® |
Cisco Intersight fournira une gestion centralisée basée sur le cloud pour le serveur dans une prochaine version, offrant des capacités telles que les opérations d’alimentation, la surveillance, la gestion de la configuration du serveur et les mises à jour du micrologiciel, simplifiant les tâches opérationnelles et garantissant un contrôle cohérent |
|
Solutions validées pour l’IA |
Fait partie de la stratégie de Cisco visant à offrir des solutions d’IA validées qui englobent le calcul, le réseau, le stockage et les logiciels, garantissant des performances fiables et optimisées pour les usines d’IA |
|
Infrastructure évolutive |
Optimisé pour les plateformes GPU haute densité, offrant des performances prévisibles dans les usines d’IA et permettant une expansion flexible au sein des POD d’IA de Cisco pour répondre aux demandes croissantes de l’IA |
Spécifications du produit
Tableau 2. Spécifications clés du serveur rack Cisco UCS C880A M8 (configurations basées sur le GPU NVIDIA HGX B300)
|
Composant |
Spécification |
|
Facteur de forme |
Serveur rack 10RU 19” (basé sur l’architecture de référence HGX de NVIDIA) |
|
Processeurs |
2x Intel Xeon de 6e génération 6776P ou 2x Intel Xeon de 6e génération 6767P |
|
Mémoire |
32x 64 Go DDR5 RDIMM ou 32x 96 Go DDR5 RDIMM ou 32x 128 Go DDR5 RDIMM |
|
GPU |
8x Nvidia HGX B300 NVL8 |
|
Disque de démarrage |
2x SSD SATA M.2 de 960 Go avec contrôleur RAID |
|
Stockage interne |
Jusqu’à 8 SSD NVMe PCIe Gen5 x4 E1.S |
|
Mise en réseau E-O |
8x ConnectX-8 intégrés à la carte GPU |
|
Mise en réseau N-S |
2x CX-7 2x200G (crypto) ou 2x B3220 2x200G (crypto) ou 2x B3240 2x400G (crypto) 1x OCP TFF Gen5 x8 |
|
Alimentation |
12x 80PLUS 50V 3,2 kW MCRPS PSUs redondants remplaçables à chaud (N+N) |
|
Gestion |
Cisco BMC |
|
Interopérabilité matérielle et logicielle |
Voir la liste d’interopérabilité matérielle et logicielle de Cisco pour une liste complète des systèmes d’exploitation et des options périphériques pris en charge |
Informations de commande
Tableau 3. Informations de commande
|
Réf. # |
Description du produit |
|
UCSC-880A-M8-B301 |
2 CPU Intel Xeon 6776P 2,3 GHz (Max Turbo 3,9 GHz), 8 GPU NVIDIA HGX B300 SXM, 32 DIMM 96 Go jusqu’à 5 200 MT/s, 2 disques de démarrage SATA M.2 960 Go, 2 disques de données SSD NVMe E1.S 3,84 To, 8 NVIDIA ConnectX-8 (intégrés à la carte GPU) pour le réseau Est/Ouest, 2 NVIDIA ConnectX-7 (2x200G) compatibles crypto pour le réseau Nord/Sud, 1 Intel X710-T2L OCP |
|
UCSC-880A-M8-B302 |
2 CPU Intel Xeon 6776P 2,3 GHz (Max Turbo 3,9 GHz), 8 GPU NVIDIA HGX B300 SXM, 32 DIMM 96 Go jusqu’à 5 200 MT/s, 2 disques de démarrage SATA M.2 960 Go, 2 disques de données SSD NVMe E1.S 3,84 To, 8 NVIDIA ConnectX-8 (intégrés à la carte GPU) pour le réseau Est/Ouest, 2 NVIDIA B3220 (2x200G) compatibles crypto pour le réseau Nord/Sud, 1 Intel X710-T2L OCP |
|
UCSC-880A-M8-B303 |
2 CPU Intel Xeon 6776P 2,3 GHz (Max Turbo 3,9 GHz), 8 GPU NVIDIA HGX B300 SXM, 32 DIMM 128 Go jusqu’à 5 200 MT/s, 2 disques de démarrage SATA M.2 960 Go, 2 disques de données SSD NVMe E1.S 3,84 To, 8 NVIDIA ConnectX-8 (intégrés à la carte GPU) pour le réseau Est/Ouest, 2 NVIDIA ConnectX-7 (2x200G) compatibles crypto pour le réseau Nord/Sud, 1 Intel X710-T2L OCP |
|
UCSC-880A-M8-B304 |
2 CPU Intel Xeon 6776P 2,3 GHz (Max Turbo 3,9 GHz), 8 GPU NVIDIA HGX B300 SXM, 32 DIMM 128 Go jusqu’à 5 200 MT/s, 2 disques de démarrage SATA M.2 960 Go, 2 disques de données SSD NVMe E1.S 3,84 To, 8 NVIDIA ConnectX-8 (intégrés à la carte GPU) pour le réseau Est/Ouest, 2 NVIDIA B3220 (2x200G) compatibles crypto pour le réseau Nord/Sud, 1 Intel X710-T2L OCP |
|
UCSC-880A-M8-B305 |
2 CPU Intel Xeon 6776P 2,3 GHz (Max Turbo 3,9 GHz), 8 GPU NVIDIA HGX B300 SXM, 32 DIMM 96 Go jusqu’à 5 200 MT/s, 2 disques de démarrage SATA M.2 960 Go, 2 disques de données SSD NVMe E1.S 3,84 To, 8 NVIDIA ConnectX-8 (intégrés à la carte GPU) pour le réseau Est/Ouest, 2 NVIDIA B3240 (2x400G) compatibles crypto pour le réseau Nord/Sud, 1 Intel X710-T2L OCP |
|
UCSC-880A-M8-B306 |
2 CPU Intel Xeon 6776P 2,3 GHz (Max Turbo 3,9 GHz), 8 GPU NVIDIA HGX B300 SXM, 32 DIMM 128 Go jusqu’à 5 200 MT/s, 2 disques de démarrage SATA M.2 960 Go, 2 disques de données SSD NVMe E1.S 3,84 To, 8 NVIDIA ConnectX-8 (intégrés à la carte GPU) pour le réseau Est/Ouest, 2 NVIDIA B3240 (2x400G) compatibles crypto pour le réseau Nord/Sud, 1 Intel X710-T2L OCP |
|
UCSC-880A-M8-B307 |
2 CPU Intel Xeon 6776P 2,3 GHz (Max Turbo 3,9 GHz), 8 GPU NVIDIA HGX B300 SXM, 32 DIMM 64 Go jusqu’à 5 200 MT/s, 2 disques de démarrage SATA M.2 960 Go, 2 disques de données SSD NVMe E1.S 3,84 To, 8 NVIDIA ConnectX-8 (intégrés à la carte GPU) pour le réseau Est/Ouest, 2 NVIDIA ConnectX-7 (2x200G) compatibles crypto pour le réseau Nord/Sud, 1 Intel X710-T2L OCP |
|
UCSC-880A-M8-B308 |
2 CPU Intel Xeon 6767P 2,3 GHz (Max Turbo 3,9 GHz), 8 GPU NVIDIA HGX B300 SXM, 32 DIMM 96 Go jusqu’à 5 200 MT/s, 2 disques de démarrage SATA M.2 960 Go, 2 disques de données SSD NVMe E1.S 3,84 To, 8 NVIDIA ConnectX-8 (intégrés à la carte GPU) pour le réseau Est/Ouest, 2 NVIDIA ConnectX-7 (2x200G) compatibles crypto pour le réseau Nord/Sud, 1 Intel X710-T2L OCP |
Informations sur la garantie
Les serveurs rack Cisco UCS C880A M8 sont assortis d’une garantie matérielle de trois ans et d’une garantie logicielle de 90 jours.

