Pourquoi l'IA fait-elle grimper le prix des SSD ?

L'IA fait grimper les prix des SSD partout dans le monde, et la raison principale en est un déséquilibre marqué entre une demande en forte hausse et les limites structurelles de l'offre. Les applications d'IA couvrant l'ensemble de la chaîne, telles que l'entraînement de grands modèles linguistiques, l'inférence IA et la génération augmentée par la recherche, ont généré une demande en SSD de la part des entreprises bien supérieure à celle du marché grand public traditionnel. Les achats en gros effectués par les fournisseurs de cloud et les entreprises spécialisées dans l'IA épuisent rapidement la capacité de production de mémoire flash NAND. Du côté de l'offre, les fabricants de solutions de stockage réorientent en priorité leur capacité vers les produits d'entreprise, qui génèrent des marges plus élevées. Parallèlement, l'expansion de la technologie HBM, les pénuries de DRAM et les contrats d'approvisionnement à long terme réduisent encore davantage la capacité restante pour les SSD grand public. Si l'on ajoute à cela les longs délais de production des plaquettes NAND — les nouvelles capacités ne peuvent pas combler rapidement le déficit —, il en résulte une offre restreinte et une hausse des prix pour les consommateurs lambda.

La formation et l'inférence en IA stimulent la forte hausse de la demande en SSD

La demande en matière d'IA pour SSD ne se limite pas à un seul secteur de l'industrie. Elle couvre l'ensemble de la chaîne, du développement des modèles à leur utilisation dans le monde réel. Deux domaines clés — la formation des grands modèles de langage (LLM) et l'inférence IA avec génération augmentée par la récupération (RAG) — génèrent une demande de stockage bien supérieure à celle qu'a jamais connue le marché grand public traditionnel, l'un en soutenant l'infrastructure informatique et l'autre en alimentant les services quotidiens en continu.

La formation en LLM stimule une forte demande en SSD

L'entraînement des grands modèles linguistiques constitue aujourd'hui la source de demande en SSD la plus importante et la plus urgente. Le principe est simple : les entreprises ont besoin d'un stockage rapide capable de suivre le rythme de leurs clusters de GPU, qui peuvent coûter des dizaines, voire des centaines de millions de dollars. Un stockage lent laisserait ces GPU coûteux inutilisés, ce qui représenterait un énorme gaspillage d'argent. L'entraînement d'un modèle d'IA à grande échelle nécessite le traitement de dizaines de pétaoctets de texte, d'images et d'autres données mixtes. Ces données doivent être stockées sur des SSD rapides afin de prendre en charge les lectures aléatoires requises pendant l'entraînement. 

oscoo 2b bannière 1400x475 1 Pourquoi l'IA rend-elle les SSD si chers ?

Le processus d'entraînement, qui s'étend sur plusieurs mois, nécessite également des sauvegardes fréquentes de l'avancement du modèle afin d'éviter toute perte de données, ce qui impose des exigences élevées en matière de capacité et de vitesse d'écriture des SSD. Les grands modèles de langage (LLM) modernes sont entraînés sur des clusters distribués comptant des milliers, voire des dizaines de milliers de GPU. Chaque serveur GPU a besoin d'un grand nombre de SSD locaux pour stocker des copies des données et les résultats intermédiaires, ce qui fait grimper en flèche la demande totale en stockage. Pour les entreprises spécialisées dans l'IA, le coût lié à l'ajout de SSD est minime par rapport aux pertes quotidiennes générées par des GPU inutilisés. Elles équipent donc chaque serveur d'autant de SSD haute vitesse que possible, épuisant rapidement la capacité de production mondiale de SSD.

L'inférence IA et le RAG alimentent une croissance soutenue et généralisée de la demande

Si l'entraînement des grands modèles linguistiques constitue un choc ponctuel et intense sur la demande à court terme, l'inférence IA et les applications RAG représentent un moteur de croissance plus large et plus durable. L'IA a quitté les laboratoires de recherche pour s'intégrer dans la vie quotidienne. Des milliards de requêtes quotidiennes — pour les chats IA, la génération d'images et la recherche intelligente — nécessitent que les modèles d'IA (qui pèsent souvent plusieurs centaines de gigaoctets) se chargent rapidement pour fournir des réponses instantanées. Un stockage lent ruinerait l'expérience utilisateur. 

Par ailleurs, la technologie RAG, largement utilisée par les entreprises, stocke d’énormes volumes de documents et de données sous forme de vecteurs. Chaque requête doit permettre de trouver rapidement les informations correspondantes parmi des millions d’entrées vectorielles, une tâche que seuls les SSD rapides sont capables de gérer. Contrairement à l’entraînement, l’inférence et le RAG fonctionnent 24 heures sur 24, 7 jours sur 7, comme des services classiques. Des assistants IA personnels aux systèmes intelligents d'entreprise, leur déploiement connaît une croissance exponentielle. Les fournisseurs de cloud et les entreprises accordent la priorité aux performances de stockage pour maintenir la compétitivité de leurs services, de sorte que la demande en matière d'inférence continue de grignoter la capacité SSD restante dans le monde.

En résumé, l'entraînement épuise rapidement les capacités existantes en raison d'achats massifs et concentrés, tandis que l'inférence fait progressivement croître la demande totale grâce à une utilisation généralisée et continue. Ensemble, ces deux facteurs ont profondément modifié la structure de la demande sur le marché des SSD et ont fait du stockage à haute vitesse une ressource essentielle dans le secteur de l'IA.

Réduction structurelle du côté de l'offre

L'explosion de la demande exerce déjà une pression considérable sur la capacité mondiale de production de mémoires NAND. À cela s'ajoutent plusieurs facteurs structurels du côté de l'offre qui réduisent encore davantage les marges de manœuvre pour la production de SSD grand public, aggravant ainsi le déséquilibre entre l'offre et la demande. Des priorités en matière de rentabilité aux changements d'organisation de la production, des modèles de partenariat industriel aux règles du cycle de fabrication, chaque élément du système s'oriente vers les cas d'utilisation de l'IA en entreprise — et la pression finit par retomber sur le marché grand public.

Les marges plus élevées incitent les fabricants à privilégier les SSD d'entreprise pour l'IA

L'essor de l'IA a entraîné une forte demande en centres de données et SSD d'entreprise, et cela a également creusé l'écart de rentabilité entre les gammes de produits. Disques SSD d'entreprise conçus pour l'IA Les serveurs et les fournisseurs de services cloud affichent des prix unitaires et des marges bénéficiaires bien plus élevés que les SSD grand public classiques. Une même capacité de plaquettes NAND génère des bénéfices plusieurs fois supérieurs lorsqu’elle est utilisée pour des produits destinés aux entreprises. La production globale étant limitée, les principaux fabricants de solutions de stockage affectent en priorité la majeure partie de leur capacité NAND haut de gamme aux commandes de SSD destinés aux entreprises et aux centres de données. Les SSD grand public se retrouvent ainsi à se disputer la faible quantité de capacité restante. Cette offre en baisse entraîne une hausse directe des prix de détail pour les consommateurs.

La production de HBM réduit la capacité de la mémoire flash NAND

À mesure que le secteur de l'IA connaît une croissance rapide, la demande en HBM (mémoire à grande largeur de bande) La demande en serveurs d'IA haut de gamme a explosé, détournant les capacités de production de cœurs et les ressources en plaquettes des fabricants de solutions de stockage. La mémoire HBM et la technologie 3D Flash NAND Les composants utilisés dans les SSD sont tous deux des semi-conducteurs de mémoire, et ils partagent certaines lignes de production de pointe ainsi que des équipements de fabrication essentiels. Afin de s’emparer du marché très rentable de la mémoire pour l’IA, les principaux fabricants tels que Samsung, Kioxia et Micron ont profondément remanié leurs plans de production. Ils réaffectent les capacités, les équipements et le personnel d’ingénierie qui étaient auparavant dédiés à la fabrication de mémoire flash NAND à la production de HBM. Cela réduit directement l'offre de plaquettes NAND nécessaires aux SSD grand public. En plus de l'offre déjà restreinte due à la demande en IA, cela crée un déficit de capacité encore plus important pour les SSD grand public et constitue une cause majeure de la pénurie de stocks et de la hausse des prix.

La pénurie de disques durs fait basculer la demande en stockage pour l'IA vers les SSD

La plupart des besoins considérables de l'IA en matière de stockage de données « froides » étaient initialement destinés à Disques durs (HDD). Cependant, la production de disques durs (HDD) n'a progressé que lentement ces dernières années, et les achats en gros effectués par les centres de données spécialisés dans l'IA ont entraîné des pénuries d'approvisionnement et des retards de livraison manifestes à l'échelle mondiale. Afin de respecter le calendrier de leurs déploiements d'IA, les fournisseurs de services cloud et les centres de données ont dû adapter leurs configurations de stockage. Ils utilisent désormais des SSD d'entreprise à haute capacité pour certaines données « chaudes » et fréquemment consultées qui étaient initialement prévues pour des disques durs. Cet effet de substitution crée une demande supplémentaire en SSD, épuisant encore davantage la capacité de mémoire flash NAND déjà limitée. Cela ne cesse de réduire l'espace de production dédié aux SSD grand public et fait indirectement grimper les prix à la consommation.

La pénurie de DRAM fait des SSD une mémoire supplémentaire

L'entraînement et l'inférence des modèles d'IA nécessitent également d'énormes quantités de DRAM, et la production mondiale de DRAM est tout aussi limitée. La DRAM haut de gamme de type HBM et la DRAM de qualité serveur sont constamment en pénurie. Pour alléger la pression sur la mémoire et maîtriser les coûts matériels, les fournisseurs de cloud et les entreprises spécialisées dans l'IA ont désormais largement recours à des SSD NVMe rapides comme extension ou complément de la DRAM. Grâce à la technologie de stockage hiérarchisé, ils transfèrent les données actives non critiques, telles que les poids de modèles et les caches temporaires, de la mémoire vers les SSD. Les SSD passent ainsi du statut de simples périphériques de stockage à celui d’une sorte de mémoire secondaire, ce qui stimule encore davantage les achats de SSD par les entreprises. Cela accentue encore la saturation de la capacité limitée de la mémoire flash NAND, laisse moins de place aux SSD grand public et fait grimper les prix de détail.

Les contrats à long terme réservent la majeure partie de la capacité aux grands clients du secteur de l'IA

Pour garantir la fiabilité de leurs services d'IA, les fournisseurs mondiaux de cloud computing et les principales entreprises du secteur de l'IA concluent des accords d'approvisionnement à long terme avec les trois grands fabricants de solutions de stockage : Samsung, Micron et Kioxia. Ces accords garantissent la majeure partie de la capacité des SSD et des mémoires flash NAND destinés aux entreprises pour les un à deux prochaines années, à des prix et des volumes fixes. Cette réservation à grande échelle signifie que la grande majorité de la production limitée est réservée aux grands clients de l'IA. Il reste donc beaucoup moins de capacité pour le marché libre et les SSD grand public. La pénurie d'approvisionnement sur le marché grand public fait grimper les prix de détail de plus en plus haut.

La longueur des cycles d'expansion de la production de plaquettes NAND fait que les nouvelles capacités arrivent trop tard

Les chaînes de production de mémoire flash 3D NAND nécessitent d’importants investissements et leur mise en place prend beaucoup de temps. La construction d’une usine NAND moderne haut de gamme, de la phase de construction aux essais des équipements jusqu’à la pleine production, prend entre deux et trois ans et coûte des dizaines de milliards de dollars. Face à la demande explosive liée à l'essor de l'IA, les fabricants de solutions de stockage ne peuvent pas augmenter rapidement la capacité totale de NAND à court terme. Ils ne peuvent que réorganiser l'utilisation de leur capacité de production existante. Les commandes d'IA d'entreprise à forte valeur ajoutée étant prioritaires, la part de capacité consacrée aux SSD grand public ne pourra pas augmenter de manière significative dans un avenir proche. Cet écart croissant entre l'offre et la demande est la raison sous-jacente pour laquelle les prix des SSD grand public restent élevés.

En somme, ce n’est pas tant que la capacité de production totale soit insuffisante. C’est plutôt que, sous l’impulsion des bénéfices générés par le secteur de l’IA, les ressources de production ne cessent de se réorienter vers le marché des entreprises, plus lucratif. La diminution de l’offre destinée aux consommateurs est la conséquence naturelle de cette réaffectation des ressources à l’échelle de l’ensemble du secteur.

Dans l'ensemble, la hausse des prix des SSD induite par l'IA ne constitue pas une simple fluctuation à court terme du marché. Il s'agit d'une profonde restructuration des schémas de demande et de la répartition de la production de l'ensemble du secteur du stockage. Par le passé, l'électronique grand public était le principal moteur du marché des SSD. Aujourd'hui, la demande des entreprises en matière d'IA a pris le relais, et ce changement ne devrait pas s'inverser de manière fondamentale avant plusieurs années. Pour les consommateurs, l'ère des SSD extrêmement bon marché pourrait bien être révolue pour l'instant. Les prix ne reviendront pas à leurs niveaux antérieurs tant que de nouvelles capacités de production importantes ne seront pas mises en service et que le rythme de croissance de la demande en IA ne ralentira pas progressivement.

Défiler vers le haut

Nous contacter

Remplissez le formulaire ci-dessous et nous vous contacterons dans les plus brefs délais.

Formulaire de contact