La mémoire représente désormais 63 % du coût total des composants des puces d'IA. La bulle IA fait grimper les prix de la mémoire et force des fabricants comme Microsoft à augmenter le prix de leurs appareilsUn nouveau rapport de l'institut de recherche Epoch AI révèle une transformation majeure dans la structure des coûts de fabrication des puces d'IA. Entre début 2024 et fin 2025, la part allouée à la mémoire à haute bande passante (HBM) est passée de 52 % à 63 % des dépenses totales. En d'autres termes, la mémoire représente désormais près des deux tiers du coût des composants des puces d'IA. La hausse de l'investissement dans la mémoire se fait au détriment du packaging avancé et des composants auxiliaires, dont les parts relatives diminuent. En raison de la demande massive, les fabricants font face à une explosion des coûts de production.
Epoch AI est un institut de recherche qui étudie les grandes tendances et les questions clés qui détermineront l'évolution et la gouvernance de l'IA. La société a publié ses dernières données sur l'évolution du marché des puces et accélérateurs d'IA. Les données montrent que la mémoire représente désormais 63 % des coûts des composants des puces d'IA. L'économie du matériel d'IA évolue plus rapidement que la plupart des gens ne le pensent.
Aujourd'hui, ce sont la bande passante et la capacité de la mémoire qui constituent le goulot d'étranglement, et non plus la puissance de calcul. Il faut s'attendre à ce que cela ait une incidence sur tous les domaines, de la conception des puces à la tarification du cloud, au cours des prochaines années.
Explosion rapide des coûts liés à la mémoire inquiète l'industrie
C'est un élément important pour tous ceux qui planifient des infrastructures. En effet, dans le domaine des semiconducteurs destinés à l'IA, ce n'est pas seulement le GPU ou l'accélérateur lui-même, qui effectue les calculs, qui est important, mais également la mémoire capable de traiter rapidement de grandes quantités de données. Selon les experts de l'industrie, l'entraînement et l'inférence des modèles d'IA impliquent d'énormes calculs matriciels.
Par conséquent, même si la puce de calcul est très performante, elle ne peut pas fonctionner à son plein potentiel si l'apport de données est lent. C'est pourquoi les puces destinées à l'IA utilisent de grandes quantités de mémoire à large bande passante (HBM), un type de mémoire à haute vitesse. L'image ci-dessus présente la répartition des coûts des composants d'une puce d'IA entre la mémoire, la logique, le packaging et les composants auxiliaires.
La zone représentant la part de la mémoire s'étend rapidement. La mémoire désigne les empilements HBM tels que HBM3 et HBM3e ; la logique désigne le semiconducteur de calcul lui-même, fabriqué à l'aide de procédés avancés allant de 3 nm à 5 nm ; le packaging désigne les technologies qui intègrent plusieurs puces, telles que le CoWoS de TSMC ; et les composants auxiliaires désignent les substrats et les composants d'alimentation électrique.
Au premier trimestre 2024, la répartition des coûts des composants était de 52 % pour la mémoire, 14 % pour la logique, 19 % pour le packaging et 15 % pour les composants auxiliaires. Mais au quatrième trimestre 2025, la part de chaque composant a évolué. La part de la mémoire a nettement augmenté à 63 %, la logique est restée relativement stable aux alentours de 13 %, le packaging a diminué à 15 %, et les composants auxiliaires à 10 %.
Bien que le nom « puce d'IA » puisse laisser penser que la logique de calcul est le composant le plus coûteux, en réalité, la mémoire représente désormais la majorité du coût des composants. Dans le cadre de son étude, Epoch AI a analysé les puces IA conçues par Nvidia, AMD, Google et Amazon.
Les dépenses consacrées à la mémoire augmentation en valeur
L'une des raisons de l'augmentation de la part de la mémoire réside dans le fait que les puces destinées à l'IA nécessitent une bande passante mémoire élevée. Contrairement aux modules DRAM classiques, la mémoire à haute bande passante utilisée dans les puces d'IA empile verticalement plusieurs puces mémoire et les relie par des voies de données larges, ce qui permet la lecture et l'écriture à grande vitesse de volumes importants de données.
Dans le traitement des grands modèles de langage (LLM) et de l'IA de génération d'images, les paramètres et les données intermédiaires sont fréquemment échangés, ce qui fait de la capacité et de la bande passante mémoire des éléments qui influent à la fois sur les performances et sur les coûts.
Les dépenses liées à la mémoire ont connu une forte augmentation en valeur. Selon Epoch AI, les dépenses liées à la mémoire pour les puces d'IA conçues par Nvidia, AMD, Google et Amazon sont passées de 12 milliards de dollars en 2024 à environ 32 milliards de dollars en 2025. Les dépenses globales en composants pour les puces d'IA ont aussi augmenté, passant d'environ 22 milliards de dollars en 2024 à environ 52 milliards de dollars en 2025.
Cette augmentation est attribuée à hauteur d'environ 20 milliards de dollars aux dépenses liées à la mémoire. Cela dit, notons que les chiffres fournis par Epoch AI sont des estimations et non des valeurs mesurées avec précision. Les prix unitaires des composants varient en fonction des conditions contractuelles, des fournisseurs et du moment de l'achat, et des incertitudes subsistent quant au volume de production et à la configuration de chaque puce.
Epoch AI modélise la fourchette des coûts des composants en utilisant un intervalle de confiance de 90 %, et explique que le ratio de mémoire de 63 % pour le quatrième trimestre 2025 se situe entre 60 % et 67 % si l'on ne tient compte que de la fourchette de coûts de la mémoire seule, et entre 54 % et 73 % si l'on tient compte simultanément des incertitudes liées à l'ensemble des composants. Cette proportion peut varier d'une étude à une autre.
Impact de l'augmentation du coût de la mémoire sur l'industrie
Epoch AI indique : « à mesure que l'offre de mémoire se resserre et que les prix augmentent, la mémoire pourrait représenter une part encore plus importante des coûts des composants des puces d'IA en 2026 ». La hausse des prix des composants aurait également influencé les prévisions de dépenses d'investissement de Microsoft pour l'exercice 2026, ainsi que la révision à la hausse par Meta de sa fourchette de dépenses d'investissement pour 2026.
Lorsqu'on examine le coût des puces d'IA, non seulement les performances de calcul des GPU et des accélérateurs, mais aussi l'offre et le prix de la mémoire sont des facteurs importants. Epoch AI affirme : « la mémoire a été le principal moteur de l'augmentation des dépenses en composants de puces d'IA entre 2024 et 2025, et les prix de la mémoire évoluent pour jouer un rôle croissant dans la compréhension des coûts d'infrastructure d'IA ».
Hausse des prix des appareils due à la cherté de la mémoire
Microsoft a augmenté les prix de l'ensemble de sa gamme d'ordinateurs Surface, invoquant la hausse des coûts de la mémoire et des composants due aux contraintes d'approvisionnement liées à la demande croissante de l'industrie de l'IA. Ces augmentations font passer les appareils de milieu de gamme de Microsoft au-dessus de 1 000 dollars et les modèles phares au-delà de 1 500 dollars, ce qui les rend plus chers que les offres Mac équivalentes.
Cette évolution des prix reflète une pression plus générale qui touche le secteur, les fabricants de puces donnant la priorité à la mémoire destinée aux centres de données pour l'IA, ce qui limite l'offre pour les appareils grand public. Selon les analystes, la tendance devrait s'étendre sur plusieurs années.
Gartner prévoit que le chiffre d'affaires mondial du secteur des semiconducteurs devrait dépasser 1 300 milliards de dollars en 2026, sous l'effet de l'explosion de la demande de l'industrie de l'IA. Selon Gartner, le secteur des semiconducteurs est sur le point d'enregistrer une troisième année consécutive de croissance à deux chiffres, alimentée par une demande importante en matière de mémoire et d'infrastructures pour les centres de données.
Gartner ajoute que le phénomène de « memflation » fera grimper les prix des DRAM et des mémoires flash NAND de 125 % et 234 % respectivement. Il devrait anéantir, ou retarder, la demande hors IA jusqu’en 2028, ce qui pourrait avoir un impact sur les stratégies d'approvisionnement des DSI et des responsables informatiques. Alors que la bulle IA ne montre aucun signe de ralentissement, le prix de la mémoire devrait continuer à grimper.
Pénurie de mémoire : un autre impact négatif de la bulle IA
La vague actuelle d'engouement pour l'IA ne semble pas près de s'essouffler. Ainsi, une fois que les stocks de technologies grand public existants des fabricants seront épuisés, les consoles, les ordinateurs portables et bien d'autres encore pourraient connaître une forte augmentation de prix au fil du temps. La volatilité entre la demande en IA et les droits de douane explique pourquoi nous n'avons obtenu les prix de la Xbox Ally qu'à la dernière minute.
Elle explique également pourquoi nous ne connaissons toujours pas les prix de la Steam Machine. La situation est tout simplement « folle » en ce moment. Les premiers à en ressentir les effets seront ceux qui achètent de la mémoire vive seule pour mettre à niveau leur PC ou leur ordinateur portable existant.
La capacité mondiale de production de RAM est limitée, ce qui signifie que la demande dépassera probablement l'offre bientôt. Samsung, SK Hynix et Micron contrôlent à eux trois environ 90 % du marché. Les fabricants de produits grand public achèteront directement les puces de ces entreprises pour leurs propres produits. De l'autre côté, on assiste aux achats démesurés d'entreprises comme OpenAI et Meta, inondées de liquidités provenant d'investisseurs.
Les simples mortels devront se contenter des miettes pour le moment. C'est peut-être une raison de plus parmi tant d'autres de détester cette grande mode de l'IA : destruction des moyens de subsistance, gaz à effet de serre, hausse du prix de l'électricité, licenciements, vol des réserves d'eau, produits chimiques toxiques, industrie de la désinformation à plein régime, dégradation de la santé mentale et, désormais, flambée des prix des biens de consommation.
Prédictions des experts du secteur sur cette pénurie
« Il n'y aura pas d'amélioration avant 2028 », a déclaré Lip-Bu Tan, PDG d'Intel, après s'être entretenu avec deux des trois grands fabricants de mémoires. L'un d'eux, Micron, a publiquement fait la même déclaration, affirmant que son usine de mémoires de l'Idaho n'ouvrirait pas avant mi-2027 et qu'il ne faudrait pas s'attendre à une production réelle avant 2028. SK Hynix avait également prédit que la pénurie durerait jusqu'à la fin de l'année 2027.
Si Micron, SK Hynix et Samsung gagnent suffisamment d'argent pour augmenter leur production, la construction des nouvelles usines promises prendra du temps. Ils considèrent également qu'il est plus rentable et moins risqué de construire lentement plutôt que de se précipiter pour répondre à la demande.
Il n'y a pas si longtemps, certains fabricants de mémoires perdaient de l'argent à cause d'une surproduction. « Ce qui est effrayant dans ce secteur, c'est que si vous surproduisez, vous finissez par faire faillite », a déclaré Dylan Patel, PDG de SemiAnalysis. Samsung devrait augmenter son offre de plaquettes de mémoire de seulement 5 % cette année. En attendant, les fabricants de RAM vont tirer le maximum de profits, au détriment des consommateurs.
Source : Epoch AI
Et vous ?
Quel est votre avis sur le sujet ?
Que pensez-vous de la tendance à la hausse des prix de la mémoire ?
Cette tendance pourrait perdurer en raison de la demande de l'industrie de l'IA. Qu'en pensez-vous ?
Que pensez-vous de l'impact de la flambée des prix de la mémoire sur les appareils électroniques grand public ?Voir aussi
Les prix de la mémoire vive DDR5 ont plus que quadruplé depuis septembre 2025, alors que la folie de la bulle de l'IA accapare une part importante de production mondiale de mémoires et alimente une pénurie
Microsoft a augmenté les prix de tous ses PC Surface, les rendant plus chers que les Mac équivalents, en raison de la récente hausse des coûts de la mémoire et des composants provoquée par l'infâme bulle IA
Le revenu des semiconducteurs devrait dépasser 1 300 milliards $ et les prix de la DRAM devraient augmenter de 125 % en 2026 : la "memflation" va anéantir la demande hors IA jusqu'à 2028, d'après Gartner
Vous avez lu gratuitement 2 616 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.

