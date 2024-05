L'optimisation spécifique à l'application permet d'obtenir de meilleures performances par watt

Puissance du centre de données

Catalyseur de l'évolution énergétique dans l'industrie informatique

Des superordinateurs tels que le Frontier d'Oak Ridge National Laboratory, alimenté par AMD, tirent parti de l'accélération des calculs pour faire progresser la recherche scientifique, la génomique, la découverte de nouveaux médicaments, les prévisions climatiques, ainsi que les avancées clés dans le domaine de l'intelligence artificielle, qui sera la technologie déterminante de la prochaine génération d'ordinateurs. En fait, AMD équipe désormais huit des dix superordinateurs les plus économes en énergie figurant sur la dernière liste Green500, y compris les deux superordinateurs les plus puissants du top 10, Frontier et le superordinateur Adastra.L'explosion des modèles de langage de grande taille (LLM) comme ChatGPT a mis en évidence les préoccupations relatives à l'utilisation massive de l'énergie par l'IA. La formation et l'exploitation de ces modèles nécessitent des quantités énormes de puissance de calcul, ce qui entraîne une consommation d'énergie exponentielle. Les plus grands modèles actuels sont formés sur des dizaines de milliers de GPU, consommant des mégawattheures d'énergie. Cette demande énergétique croissante exerce une pression sur les infrastructures existantes, les obligeant à s'adapter rapidement pour répondre à ces besoins sans précédent, tout en posant des défis environnementaux importants.Anticipant cette problématique, AMD a dès 2021 entrepris des initiatives pour améliorer l'efficacité énergétique de ses produits, reconnaissant l'appétit vorace de l'IA en matière d'énergie. En lançant son objectif 30x25, AMD s'est fixé comme priorité de multiplier par 30 l'efficacité énergétique des nœuds de calcul des centres de données d'ici 2025, par rapport aux niveaux de 2020. Cette vision proactive visait à répondre aux besoins énergétiques croissants et à atténuer l'impact environnemental de l'IA, tout en assurant la viabilité et la durabilité de l'expansion des centres de données à long terme.AMD adopte une stratégie globale à plusieurs volets pour améliorer l'efficacité énergétique, dépassant les seules architectures de silicium et les stratégies d'emballage avancées. Cette approche inclut également des architectures spécifiques à l'IA, des optimisations au niveau du système et des centres de données, ainsi que des initiatives de co-conception logicielle et matérielle. Le silicium reste au cœur de cette stratégie. Lisa Su a souligné que les transistors Gate All Around (GAA) de 3 nm représentent la prochaine étape de la feuille de route d'AMD pour améliorer l'efficacité énergétique et les performances. Parallèlement, AMD met l'accent sur des techniques d'emballage et d'interconnexion avancées pour créer des conceptions modulaires plus efficaces et rentables. L'emballage avancé, utilisant un mélange de technologies 2,5D et 3D, permet de maximiser la puissance de calcul par watt pour chaque millimètre carré de silicium dans les centres de données.Optimiser la localisation des données pour réduire le transfert d'énergie entre les nœuds de serveurs est une autre composante clé. Par exemple, le MI300X d'AMD, avec ses 153 milliards de transistors répartis sur 12 chiplets et 24 puces HBM3 offrant 192 Go de mémoire, illustre bien ces gains d'efficacité. L'interconnexion Infinity Fabric, optimisée pour la puissance et les performances, réduit la consommation d'énergie en maintenant les données à proximité des cœurs de traitement. Lisa Su a également mis en avant les résultats impressionnants obtenus grâce à la co-optimisation matérielle et logicielle d'AMD. L'utilisation de formats numériques de moindre précision, comme le passage au FP4, augmente considérablement l'efficacité énergétique. Les techniques de quantification avancées permettent de maintenir une précision similaire à celle des formats plus traditionnels, comme le FP32. Par exemple, le MXFP6 peut offrir une précision comparable à celle du FP32, et le MXFP4 pourrait bientôt atteindre ce niveau pour de nombreux modèles.En conclusion, AMD a surpassé le taux de progression de l'industrie en matière d'efficacité énergétique par nœud et se dirige vers une amélioration de 30 fois d'ici 2025. Lisa Su prévoit même de multiplier cette efficacité par plus de 100 d'ici 2026 ou 2027, grâce à des innovations continues : « Avec ce type d'innovation, sur la base de ce que nous voyons aujourd'hui, nous pensons que nous pouvons faire mieux que cela. Nous sommes en bonne voie pour multiplier par plus de 100 l'efficacité énergétique d'ici 2026 et 2027. Et nous pouvons faire beaucoup, beaucoup plus dans ce domaine ».Malgré ces efforts ambitieux, des questions subsistent sur la manière dont AMD compte atteindre ces objectifs, surtout en comparaison avec les avancées déjà réalisées par d'autres acteurs du marché. Certains analystes et observateurs du secteur soulignent que la feuille de route de la concurrence, en particulier celle de Nvidia, est actuellement plus avancée en termes de capacités et de performances, notamment dans le domaine des accélérateurs AI et HPC. Par ailleurs, bien que ces innovations soient prometteuses pour les centres de données, une partie du public regrette le manque d'annonces similaires pour le matériel grand public, où des améliorations significatives de l'efficacité énergétique et du support logiciel seraient également bienvenues.En réponse, AMD pourrait bénéficier d'une stratégie plus équilibrée, en ciblant non seulement les centres de données mais aussi le marché des consommateurs. Cela inclurait une meilleure prise en charge des applications basées sur l'IA sur leur propre matériel, ainsi que des initiatives visant à faciliter le développement de l'IA et du ML sur leurs plates-formes. Les concurrents d'AMD, tels que Nvidia, ont déjà une longueur d'avance dans ce domaine avec leur écosystème CUDA bien établi, et il serait avantageux pour AMD de renforcer ses efforts pour rivaliser efficacement sur ce front.Source : Lisa Su at IMEC's ITF World 2024 conferenceQuel est votre avis sur le sujet ?Comment AMD prévoit-elle de surmonter les défis de la mise à l'échelle de ses technologies d'efficacité énergétique dans un marché où Nvidia et Intel possèdent déjà une forte présence ?