KI treibt die SSD-Preise weltweit in die Höhe, und der Hauptgrund dafür ist ein starkes Missverhältnis zwischen der rasant steigenden Nachfrage und den strukturellen Grenzen des Angebots. KI-Anwendungen, die die gesamte Wertschöpfungskette abdecken – wie das Training großer Sprachmodelle, KI-Inferenz und Retrieval-Augmented Generation – haben zu einer Nachfrage nach SSDs im Unternehmensbereich geführt, die weit über die des traditionellen Verbrauchermarktes hinausgeht. Großbestellungen von Cloud-Anbietern und KI-Unternehmen zehren die Produktionskapazitäten für NAND-Flash-Speicher rasch auf. Auf der Angebotsseite verlagern Speicherhersteller ihre Kapazitäten vorrangig auf margenstärkere Unternehmensprodukte. Gleichzeitig schränken die Ausweitung von HBM, DRAM-Engpässe und langfristige Lieferbindungen die für Verbraucher-SSDs verbleibende Kapazität weiter ein. Hinzu kommt die lange Vorlaufzeit bei der NAND-Wafer-Produktion – neue Kapazitäten können die Lücke nicht schnell schließen –, was zu einem knappen Angebot und steigenden Preisen für den normalen Verbraucher führt.
KI-Training und -Inferenz sorgen für einen sprunghaften Anstieg der SSD-Nachfrage
Der Bedarf der KI an SSDs beschränkt sich nicht auf einen einzelnen Bereich der Branche. Es erstreckt sich über die gesamte Kette, von der Modellentwicklung bis hin zum Einsatz in der Praxis. Zwei Schlüsselbereiche – LLM-Training und KI-Inferenz mit Retrieval-Augmented Generation (RAG) – verursachen einen weitaus höheren Speicherbedarf als der traditionelle Verbrauchermarkt jemals hatte, wobei der eine die Recheninfrastruktur unterstützt und der andere die laufenden täglichen Dienste antreibt.
LLM-Training sorgt für massive SSD-Nachfrage
Das Training großer Sprachmodelle ist derzeit der größte und dringlichste Treiber für die Nachfrage nach SSDs. Die Logik dahinter ist einfach: Unternehmen benötigen schnellen Speicher, der mit ihren GPU-Clustern Schritt halten kann, die Kosten in Höhe von mehreren zehn oder sogar Hunderten von Millionen Dollar verursachen können. Langsamer Speicher würde dazu führen, dass diese teuren GPUs ungenutzt bleiben und enorme Summen verschwendet werden. Das Training eines groß angelegten KI-Modells erfordert die Verarbeitung von Dutzenden Petabyte an Text, Bildern und anderen gemischten Daten. Diese Daten müssen auf schnellen SSDs gespeichert werden, um die während des Trainings erforderlichen zufälligen Lesevorgänge zu unterstützen.
Der monatelange Trainingsprozess erfordert zudem häufige Speichervorgänge des Modellfortschritts, um Datenverluste zu vermeiden, was hohe Anforderungen an die SSD-Kapazität und die Schreibgeschwindigkeit stellt. Moderne LLMs werden auf verteilten Clustern mit Tausenden oder sogar Zehntausenden von GPUs trainiert. Jeder GPU-Server benötigt zahlreiche lokale SSDs zur Speicherung von Datenkopien und Zwischenergebnissen, was den Gesamtspeicherbedarf stark in die Höhe treibt. Für KI-Unternehmen sind die Kosten für die Anschaffung von SSDs verschwindend gering im Vergleich zu den täglichen Verlusten durch ungenutzte GPUs. Daher statten sie jeden Server mit so vielen Hochgeschwindigkeits-SSDs wie möglich aus und beanspruchen damit rasch die weltweite SSD-Produktionskapazität.
KI-Inferenz und RAG sorgen für ein anhaltendes, breit angelegtes Nachfragewachstum
Während das Training großer Sprachmodelle einen kurzfristigen, konzentrierten Nachfrageschub darstellt, sind KI-Inferenz und RAG-Anwendungen ein breiterer, länger anhaltender Wachstumsmotor. KI hat den Sprung aus den Forschungslabors in den Alltag geschafft. Milliarden von Anfragen täglich – für KI-Chats, Bildgenerierung und intelligente Suche – erfordern, dass KI-Modelle (oft mehrere hundert Gigabyte groß) schnell geladen werden, um sofortige Antworten zu liefern. Langsame Speicher würden das Nutzererlebnis ruinieren.
Die in Unternehmen weit verbreitete RAG-Technologie speichert riesige Mengen an Dokumenten und Daten als Vektoren. Bei jeder Abfrage müssen passende Informationen aus Millionen von Vektoreinträgen schnell gefunden werden – eine Aufgabe, die nur schnelle SSDs bewältigen können. Im Gegensatz zum Training laufen Inferenz und RAG rund um die Uhr als reguläre Dienste. Von persönlichen KI-Assistenten bis hin zu intelligenten Unternehmenssystemen nimmt der Einsatz exponentiell zu. Cloud-Anbieter und Unternehmen legen großen Wert auf Speicherleistung, um ihre Dienste wettbewerbsfähig zu halten, sodass der Bedarf an Inferenz die weltweit verbleibende SSD-Kapazität immer weiter aufzehrt.
Kurz gesagt: Das Training beansprucht durch große, konzentrierte Anschaffungen schnell vorhandene Kapazitäten, während die Inferenz durch den weit verbreiteten, kontinuierlichen Einsatz die Gesamtnachfrage stetig steigert. Zusammen haben sie die Nachfragestruktur des SSD-Marktes grundlegend verändert und Hochgeschwindigkeitsspeicher zu einer zentralen Ressource in der KI-Branche gemacht.
Struktureller Rückgang auf der Angebotsseite
Der explosionsartige Anstieg der Nachfrage hat die weltweiten NAND-Kapazitäten bereits stark unter Druck gesetzt. Hinzu kommt, dass verschiedene strukturelle Faktoren auf der Angebotsseite den Produktionsspielraum für SSDs für Endverbraucher weiter einschränken und die Lücke zwischen Angebot und Nachfrage noch vergrößern. Von Gewinnprioritäten bis hin zu Änderungen im Produktionslayout, von Branchenpartnerschaftsmodellen bis hin zu Regeln für den Fertigungszyklus – jeder Teil des Systems tendiert in Richtung von KI-Anwendungsfällen für Unternehmen – und der Druck lastet letztendlich auf dem Verbrauchermarkt.
Höhere Margen veranlassen Hersteller, Enterprise-SSDs für KI-Anwendungen Vorrang einzuräumen
Der KI-Boom hat zu einer enormen Nachfrage nach Rechenzentren und Unternehmens-SSDs, und hat zudem die Gewinnunterschiede zwischen den Produktlinien vergrößert. Enterprise-SSDs für KI Server und Cloud-Anbieter erzielen deutlich höhere Stückpreise und Gewinnspannen als bei herkömmlichen SSDs für Endverbraucher. Die gleiche NAND-Wafer-Kapazität bringt bei der Verwendung für Unternehmensprodukte ein Vielfaches an Gewinn ein. Da die Gesamtproduktion begrenzt ist, lenken die führenden Speicherhersteller den Großteil der High-End-NAND-Kapazität zunächst auf SSD-Bestellungen für Unternehmen und Rechenzentren. Consumer-SSDs müssen sich um die geringe verbleibende Kapazität streiten. Dieses schrumpfende Angebot treibt die Verkaufspreise für Verbraucher direkt in die Höhe.
Die HBM-Produktion beansprucht Kapazitäten, die sonst für NAND-Flash zur Verfügung stünden
Da die KI-Branche rasant wächst, steigt die Nachfrage nach HBM (High Bandwidth Memory) Die Nachfrage nach High-End-KI-Servern ist explosionsartig gestiegen, wodurch den Speicherherstellern Produktionskapazitäten und Wafer-Ressourcen entzogen werden. HBM und die 3D-Technologie NAND-Flash Die in SSDs verwendeten Speicherchips sind beide Halbleiter, und sie nutzen teilweise dieselben modernen Fertigungslinien und wichtige Produktionsanlagen. Um den hochprofitablen Markt für KI-Speicher zu erobern, haben führende Hersteller wie Samsung, Kioxia und Micron ihre Produktionspläne stark angepasst. Sie verlagern Kapazitäten, Anlagen und Ingenieurpersonal, die zuvor für die NAND-Flash-Produktion eingesetzt wurden, in die HBM-Fertigung. Dies führt zu einer direkten Verringerung des Angebots an NAND-Wafern, die für Consumer-SSDs benötigt werden. Zusätzlich zu der bereits angespannten Versorgungslage aufgrund der KI-Nachfrage entsteht dadurch eine noch größere Kapazitätslücke bei Consumer-SSDs, was ein Hauptgrund für knappe Lagerbestände und steigende Preise ist.
Fehlen von Festplatten verlagert die Nachfrage nach Speicherplatz für KI auf SSDs
Der Großteil des enormen Speicherbedarfs von KI für „Cold Data“ war ursprünglich für Festplatten (HDDs). Doch die HDD-Produktion hat in den letzten Jahren nur langsam zugenommen, und Großabnahmen durch KI-Rechenzentren haben weltweit zu deutlichen Lieferengpässen und Verzögerungen geführt. Um ihre KI-Implementierungen im Zeitplan zu halten, mussten Cloud-Anbieter und Rechenzentren ihre Speicherkonzepte anpassen. Sie nutzen nun hochkapazitive Enterprise-SSDs für bestimmte „warme“ und häufig abgerufene Daten, die ursprünglich für Festplatten vorgesehen waren. Dieser Substitutionseffekt schafft zusätzliche SSD-Nachfrage und beansprucht noch mehr von der ohnehin knappen NAND-Flash-Kapazität. Dies schränkt den Produktionsraum für Consumer-SSDs weiter ein und treibt indirekt die Verbraucherpreise in die Höhe.
Aufgrund von DRAM-Engpässen dienen SSDs als zusätzlicher Speicher
Auch das Training und die Inferenz von KI-Modellen erfordern riesige Mengen an DRAM, und die weltweite DRAM-Produktion ist ebenfalls begrenzt. Hochwertiges HBM und Server-DRAM sind ständig Mangelware. Um den Speicherbedarf zu entlasten und die Hardwarekosten zu kontrollieren, setzen Cloud-Anbieter und KI-Unternehmen mittlerweile in großem Umfang schnelle NVMe-SSDs als Erweiterung oder Ergänzung zum DRAM ein. Mithilfe von Tiered-Storage-Technologie verlagern sie nicht kritische Hot-Daten wie Modellgewichte und temporäre Caches vom Speicher auf SSDs. Dadurch werden SSDs von einfachen Speichergeräten zu einer Art Sekundärspeicher, was zu noch mehr SSD-Käufen in Unternehmen führt. Dies belastet die begrenzte NAND-Flash-Kapazität zusätzlich, lässt weniger Platz für Consumer-SSDs und treibt die Verkaufspreise in die Höhe.
Langfristige Verträge reservieren den Großteil der Kapazitäten für große KI-Kunden
Um den zuverlässigen Betrieb ihrer KI-Dienste zu gewährleisten, schließen globale Cloud-Anbieter und führende KI-Unternehmen langfristige Lieferverträge mit den drei großen Speicherherstellern – Samsung, Micron und Kioxia – ab. Diese Verträge sichern den Großteil der SSD- und NAND-Flash-Kapazitäten für Unternehmen für die nächsten ein bis zwei Jahre zu festen Preisen und Mengen. Diese groß angelegte Reservierung bedeutet, dass der Großteil der begrenzten Produktionskapazitäten für große KI-Kunden reserviert ist. Für den freien Markt und SSDs für Endverbraucher bleibt deutlich weniger Kapazität übrig. Das knappe Angebot auf dem Verbrauchermarkt treibt die Verkaufspreise direkt immer weiter in die Höhe.
Lange Entwicklungszyklen bei NAND-Wafern führen dazu, dass neue Kapazitäten zu spät zur Verfügung stehen
Die Produktionslinien für 3D-NAND-Flash-Speicher sind kapitalintensiv und ihre Errichtung nimmt sehr viel Zeit in Anspruch. Der Bau einer modernen High-End-NAND-Fabrik dauert von der Errichtung über die Anlagentests bis hin zur Vollproduktion zwei bis drei Jahre und kostet mehrere zehn Milliarden Dollar. Angesichts der explosiven Nachfrage durch den KI-Boom können Speicherhersteller die Gesamtkapazität für NAND-Speicher kurzfristig nicht schnell ausbauen. Sie können lediglich die Nutzung ihrer bestehenden Produktionskapazitäten neu ordnen. Da hochwertige KI-Aufträge von Unternehmen Vorrang haben, kann der Anteil der Kapazität für SSDs für Endverbraucher in absehbarer Zeit nicht nennenswert wachsen. Diese sich vergrößernde Lücke zwischen Angebot und Nachfrage ist der eigentliche Grund dafür, dass die Preise für SSDs für Endverbraucher hoch bleiben.
Insgesamt ist es nicht so, dass die Gesamtproduktionskapazität zu gering wäre. Vielmehr verlagern sich die Produktionsressourcen, angetrieben von den Gewinnen der KI-Branche, immer mehr in Richtung des höherwertigen Unternehmensmarktes. Das schrumpfende Angebot für Verbraucher ist eine natürliche Folge dieser branchenweiten Umverteilung von Ressourcen.
Insgesamt sind die durch KI bedingten Preissteigerungen bei SSDs keine kurzfristige Marktschwankung. Sie sind vielmehr Ausdruck einer tiefgreifenden Umstrukturierung der Nachfragemuster und der Produktionsverteilung in der gesamten Speicherbranche. In der Vergangenheit war die Unterhaltungselektronik der Haupttreiber des SSD-Marktes. Heute hat die KI-Nachfrage von Unternehmen die Führungsrolle übernommen, und es ist unwahrscheinlich, dass sich dieser Wandel in den nächsten Jahren grundlegend umkehren wird. Für Verbraucher könnte die Ära extrem günstiger SSDs vorerst vorbei sein. Die Preise werden erst dann wieder auf das vorherige Niveau zurückkehren, wenn große Mengen an neuen Produktionskapazitäten in Betrieb gehen und sich das Wachstum der KI-Nachfrage allmählich verlangsamt.





