Investing.com -- La solution en rack GB200 de NVIDIA nécessite une optimisation et un ajustement supplémentaires de sa chaîne d'approvisionnement, selon une récente étude de TrendForce. Les spécifications de conception complexes du rack GB200, notamment les interfaces d'interconnexion à haute vitesse et les exigences de puissance thermique (TDP) qui dépassent les normes du marché, sont les principales raisons de ce besoin. Par conséquent, TrendForce prévoit que la production de masse et le pic des expéditions auront probablement lieu entre le T2 et le T3 2025.
La série de racks GB de NVIDIA, qui comprend les modèles GB200 et GB300, se caractérise par une technologie complexe et des coûts de production plus élevés. Cela en fait une solution privilégiée pour les grands fournisseurs de services cloud (CSP) et d'autres utilisateurs potentiels tels que les centres de données de niveau 2, les fournisseurs de cloud souverain national et les institutions de recherche académique travaillant sur des applications de calcul haute performance (HPC) et d'intelligence artificielle (IA). Le modèle GB200 NVL72 devrait être le plus populaire en 2025, représentant potentiellement jusqu'à 80% des déploiements totaux à mesure que NVIDIA intensifie ses efforts de commercialisation.
La technologie propriétaire NVLink de NVIDIA est essentielle à la stratégie de l'entreprise pour améliorer les performances de calcul des systèmes serveurs IA et HPC. Cette technologie permet des connexions à haute vitesse entre les puces GPU. Le GB200 utilise la cinquième génération de NVLink, offrant une bande passante totale qui dépasse significativement la norme industrielle actuelle, PCIe 5.0.
Le TDP du serveur IA HGX, qui dominait en 2024, se situe généralement entre 60 kW et 80 kW par rack. Cependant, le TDP du GB200 NVL72 atteint 140 kW par rack, doublant ainsi les besoins en énergie. Cela a conduit les fabricants à accélérer l'adoption de solutions de refroidissement liquide, car les méthodes traditionnelles de refroidissement par air ne peuvent pas gérer de telles charges thermiques.
Les exigences de conception avancées du GB200 ont soulevé des inquiétudes quant à d'éventuels retards dans la disponibilité des composants et les expéditions de systèmes. TrendForce affirme que la production des puces GPU Blackwell progresse globalement comme prévu, avec seulement des expéditions limitées attendues au T4 2024. Le volume de production devrait augmenter progressivement à partir du T1 2025. Cependant, en raison des ajustements en cours dans la chaîne d'approvisionnement pour les composants du système serveur IA, les expéditions à la fin de 2024 devraient être inférieures aux attentes de l'industrie. Par conséquent, TrendForce prévoit que la période de pic d'expédition pour le système complet GB200 sera retardée entre le T2 et le T3 2025.
Le TDP de 140 kW du GB200 NVL72 a rendu le refroidissement liquide essentiel, car il dépasse les capacités des solutions traditionnelles refroidies par air. L'adoption de composants de refroidissement liquide gagne du terrain, les principaux acteurs de l'industrie investissant massivement dans la recherche et le développement de technologies de refroidissement liquide.
Notamment, les fournisseurs d'unités de distribution de liquide de refroidissement s'efforcent d'améliorer l'efficacité du refroidissement en augmentant la taille des racks et en développant des conceptions de plaques froides plus efficaces. Les CDU latéraux actuels peuvent dissiper entre 60 kW et 80 kW, mais les conceptions futures devraient doubler, voire tripler cette capacité de refroidissement. Le développement de systèmes CDU liquide-liquide en rangée a permis d'atteindre des performances de refroidissement supérieures à 1,3 mW, avec des améliorations supplémentaires attendues à mesure que les demandes de puissance de calcul continuent d'augmenter.
Cet article a été généré et traduit avec l'aide de l'IA et revu par un rédacteur. Pour plus d'informations, consultez nos T&C.