L'intelligenza artificiale sta facendo lievitare i prezzi degli SSD in tutto il mondo, e la ragione principale è un forte squilibrio tra la domanda in forte crescita e i limiti strutturali dell'offerta. Le applicazioni di IA a ciclo completo, come l'addestramento di modelli linguistici di grandi dimensioni, l'inferenza AI e la generazione potenziata dal recupero, hanno generato una domanda di SSD da parte delle aziende di gran lunga superiore a quella del tradizionale mercato consumer. Gli acquisti all'ingrosso da parte dei fornitori di servizi cloud e delle aziende di IA stanno rapidamente esaurendo la capacità produttiva di memorie flash NAND. Dal lato dell'offerta, i produttori di dispositivi di archiviazione stanno orientando la capacità produttiva verso prodotti aziendali a margine più elevato. Allo stesso tempo, l'espansione dell'HBM, la carenza di DRAM e gli accordi di fornitura a lungo termine riducono ulteriormente la capacità residua per gli SSD consumer. Se a ciò si aggiunge il lungo lead time per la produzione di wafer NAND — la nuova capacità non può colmare rapidamente il divario — il risultato è un'offerta limitata e un aumento dei prezzi per i consumatori comuni.
La formazione e l'inferenza nel campo dell'intelligenza artificiale determinano un'impennata della domanda di SSD
La domanda di IA per SSD non si limita a un singolo settore dell'industria. Copre l'intera catena, dallo sviluppo dei modelli all'utilizzo nel mondo reale. Due aree chiave — l'addestramento dei modelli di linguaggio di grandi dimensioni (LLM) e l'inferenza AI con generazione potenziata dal recupero (RAG) — stanno generando una domanda di storage di gran lunga superiore a quella mai registrata dal tradizionale mercato consumer, l'una supportando l'infrastruttura di calcolo e l'altra alimentando i servizi quotidiani in corso.
La formazione in materia di LLM genera una forte domanda di SSD
L'addestramento dei modelli linguistici su larga scala rappresenta oggi la fonte principale e più urgente della domanda di SSD. Il ragionamento alla base è semplice: le aziende hanno bisogno di sistemi di archiviazione veloci in grado di stare al passo con i loro cluster di GPU, che possono costare decine o addirittura centinaia di milioni di dollari. Un sistema di archiviazione lento lascerebbe queste costose GPU inattive, causando un enorme spreco di denaro. L'addestramento di un modello di IA su larga scala richiede l'elaborazione di decine di petabyte di testo, immagini e altri dati misti. Questi dati devono essere archiviati su SSD veloci per supportare le letture casuali necessarie durante l'addestramento.
Il processo di addestramento, che dura mesi, richiede inoltre frequenti salvataggi dei progressi del modello per evitare la perdita di dati, il che comporta requisiti elevati in termini di capacità degli SSD e velocità di scrittura. I moderni modelli di linguaggio di grandi dimensioni (LLM) vengono addestrati su cluster distribuiti con migliaia o addirittura decine di migliaia di GPU. Ogni server GPU necessita di numerosi SSD locali per archiviare copie dei dati e risultati intermedi, determinando un forte aumento della domanda complessiva di spazio di archiviazione. Per le aziende di IA, il costo dell'aggiunta di SSD è irrisorio rispetto alle perdite giornaliere derivanti dalle GPU inattive. Pertanto, dotano ogni server del maggior numero possibile di SSD ad alta velocità, consumando rapidamente la capacità produttiva globale di SSD.
L'inferenza AI e il RAG alimentano una crescita sostenuta e diffusa della domanda
Se l'addestramento dei modelli linguistici di grandi dimensioni rappresenta uno shock concentrato e di breve durata sulla domanda, l'inferenza AI e le applicazioni RAG costituiscono un motore di crescita più ampio e duraturo. L'intelligenza artificiale è uscita dai laboratori di ricerca per entrare nella vita quotidiana. Miliardi di richieste ogni giorno — per chat basate sull'IA, generazione di immagini e ricerca intelligente — richiedono che i modelli di IA (spesso di dimensioni pari a centinaia di gigabyte) si carichino rapidamente per fornire risposte immediate. Uno storage lento comprometterebbe l'esperienza utente.
Nel frattempo, la tecnologia RAG, ampiamente utilizzata dalle aziende, archivia enormi volumi di documenti e dati sotto forma di vettori. Ogni query deve individuare rapidamente le informazioni corrispondenti tra milioni di voci vettoriali, un compito che solo gli SSD veloci sono in grado di gestire. A differenza dell’addestramento, l’inferenza e il RAG funzionano 24 ore su 24, 7 giorni su 7, come servizi regolari. Dagli assistenti AI personali ai sistemi intelligenti aziendali, l'implementazione sta crescendo in modo esponenziale. I fornitori di servizi cloud e le aziende danno priorità alle prestazioni di archiviazione per mantenere competitivi i propri servizi, quindi la domanda di inferenza continua a intaccare la capacità SSD residua a livello mondiale.
In sintesi, l'addestramento consuma rapidamente le capacità disponibili attraverso acquisti ingenti e concentrati, mentre l'inferenza amplia costantemente la domanda complessiva grazie a un utilizzo diffuso e continuativo. Insieme, questi due fattori hanno modificato radicalmente la struttura della domanda nel mercato degli SSD e hanno reso lo storage ad alta velocità una risorsa fondamentale nel settore dell'intelligenza artificiale.
Contrazione strutturale dal lato dell'offerta
L'esplosione della domanda ha già esercitato un'enorme pressione sulla capacità globale di memorie NAND. A ciò si aggiungono diversi fattori strutturali sul fronte dell'offerta che stanno ulteriormente riducendo lo spazio produttivo dedicato agli SSD di consumo, aggravando ulteriormente il divario tra domanda e offerta. Dalle priorità di profitto ai cambiamenti nel layout di produzione, dai modelli di partnership industriali alle regole del ciclo produttivo, ogni elemento del sistema si sta orientando verso i casi d'uso dell'IA aziendale — e la pressione alla fine ricade sul mercato consumer.
I margini più elevati spingono i produttori a dare priorità agli SSD aziendali per l'IA
Il boom dell'intelligenza artificiale ha generato un'enorme domanda di data center e SSD aziendali, e ha inoltre ampliato il divario di redditività tra le linee di prodotti. SSD aziendali progettati per l'intelligenza artificiale I server e i fornitori di servizi cloud hanno prezzi unitari e margini di profitto molto più elevati rispetto ai normali SSD destinati al mercato consumer. A parità di capacità del wafer NAND, l'utilizzo per prodotti aziendali garantisce profitti molte volte superiori. A causa della produzione complessiva limitata, i principali produttori di dispositivi di archiviazione stanno destinando la maggior parte della capacità NAND di fascia alta innanzitutto agli ordini di SSD per aziende e data center. Gli SSD consumer si ritrovano a contendersi la piccola quantità di capacità rimanente. Questa contrazione dell'offerta fa aumentare direttamente i prezzi al dettaglio per i consumatori.
HBM Production sottrae capacità alla memoria flash NAND
Con la rapida crescita del settore dell'intelligenza artificiale, la domanda di HBM (High Bandwidth Memory) La domanda di server AI di fascia alta è esplosa, sottraendo capacità produttiva e risorse di wafer ai produttori di sistemi di archiviazione. HBM e la tecnologia 3D Flash NAND I componenti utilizzati negli SSD sono entrambi semiconduttori di memoria e condividono alcune linee di produzione avanzate e attrezzature chiave per la fabbricazione. Per conquistare il mercato altamente redditizio delle memorie per l'IA, i principali produttori come Samsung, Kioxia e Micron hanno modificato in modo significativo i propri piani di produzione. Stanno trasferendo capacità produttive, attrezzature e personale tecnico precedentemente impiegati nella produzione di memorie flash NAND verso la produzione di HBM. Ciò riduce direttamente l'offerta di wafer NAND necessaria per gli SSD consumer. Oltre alla fornitura già limitata a causa della domanda di IA, ciò crea un divario di capacità ancora maggiore per gli SSD consumer ed è una delle ragioni principali della scarsità di scorte e dell'aumento dei prezzi.
La carenza di HDD spinge la domanda di archiviazione per l'IA verso gli SSD
La maggior parte dell'enorme fabbisogno di archiviazione dei dati a basso utilizzo dell'IA era originariamente destinato a HDD (dischi rigidi). Negli ultimi anni, però, la produzione di HDD è cresciuta lentamente e gli acquisti all'ingrosso da parte dei data center dedicati all'IA hanno causato evidenti carenze di offerta e ritardi nelle consegne a livello mondiale. Per garantire il rispetto delle tempistiche nelle implementazioni di IA, i fornitori di servizi cloud e i data center hanno dovuto adeguare le proprie configurazioni di archiviazione. Ora utilizzano SSD aziendali ad alta capacità per alcuni dati "warm" e di accesso frequente che originariamente erano destinati agli HDD. Questo effetto di sostituzione crea una domanda aggiuntiva di SSD, consumando ancora di più la capacità già limitata delle memorie flash NAND. Ciò continua a ridurre lo spazio di produzione per gli SSD consumer e, indirettamente, fa aumentare i prezzi al consumo.
La carenza di DRAM fa sì che gli SSD fungano da memoria aggiuntiva
Anche l'addestramento e l'inferenza dei modelli di IA richiedono enormi quantità di DRAM, e la produzione globale di DRAM è altrettanto limitata. La DRAM di fascia alta e quella di livello server sono costantemente in carenza. Per alleviare la pressione sulla memoria e contenere i costi hardware, i fornitori di servizi cloud e le aziende specializzate in IA stanno ora utilizzando ampiamente gli SSD NVMe veloci come estensione o integrazione della DRAM. Grazie alla tecnologia di archiviazione a più livelli, spostano i dati caldi non critici, come i pesi dei modelli e le cache temporanee, dalla memoria agli SSD. Questo trasforma gli SSD da semplici dispositivi di archiviazione in una sorta di memoria secondaria, generando un aumento degli acquisti di SSD da parte delle aziende. Ciò affolla ulteriormente la limitata capacità della memoria flash NAND, lasciando meno spazio agli SSD destinati ai consumatori e facendo aumentare i prezzi al dettaglio.
Gli accordi con vincolo a lungo termine riservano la maggior parte della capacità ai grandi clienti del settore dell'intelligenza artificiale
Per garantire l'affidabilità dei propri servizi di IA, i principali fornitori di servizi cloud e le aziende leader nel settore dell'IA stanno stipulando accordi di fornitura a lungo termine con i tre grandi produttori di dispositivi di archiviazione: Samsung, Micron e Kioxia. Questi accordi assicurano la maggior parte della capacità di SSD aziendali e di memorie flash NAND per i prossimi uno o due anni a prezzi e volumi fissi. Questa prenotazione su larga scala significa che la stragrande maggioranza della produzione limitata viene riservata ai grandi clienti dell'IA. Rimane una capacità molto inferiore per il mercato libero e gli SSD consumer. L'offerta limitata nel mercato consumer spinge direttamente i prezzi al dettaglio sempre più in alto.
I lunghi cicli di espansione dei wafer NAND comportano un ritardo nell'arrivo di nuova capacità
Le linee di produzione di memorie flash 3D NAND richiedono ingenti investimenti di capitale e tempi di realizzazione molto lunghi. La realizzazione di un moderno stabilimento NAND di fascia alta richiede dai 2 ai 3 anni, dalla costruzione al collaudo delle attrezzature fino alla piena operatività, e costa decine di miliardi di dollari. Di fronte alla domanda esplosiva generata dal boom dell'IA, i produttori di dispositivi di archiviazione non sono in grado di espandere rapidamente la capacità totale di NAND nel breve termine. Possono solo riorganizzare l'utilizzo della capacità produttiva esistente. Poiché gli ordini di IA aziendale ad alto valore hanno la priorità, la quota di capacità destinata agli SSD consumer non potrà crescere in modo significativo nell'immediato futuro. Questo crescente divario tra domanda e offerta è la ragione alla base del mantenimento dei prezzi elevati degli SSD consumer.
Tutto sommato, non è che la capacità produttiva complessiva sia troppo bassa. Piuttosto, spinte dai profitti del settore dell'intelligenza artificiale, le risorse produttive continuano a spostarsi verso il mercato aziendale, che offre un valore aggiunto maggiore. La contrazione dell'offerta destinata ai consumatori è una conseguenza naturale di questa riallocazione delle risorse a livello settoriale.
Nel complesso, gli aumenti dei prezzi degli SSD determinati dall’intelligenza artificiale non rappresentano una semplice oscillazione di mercato a breve termine. Si tratta piuttosto di una profonda ristrutturazione dei modelli di domanda e dell’allocazione della produzione nell’intero settore dello storage. In passato, l’elettronica di consumo era il principale motore del mercato degli SSD. Oggi, la domanda di IA da parte delle aziende ha assunto un ruolo di primo piano, ed è improbabile che questo cambiamento subisca un'inversione di tendenza sostanziale per diversi anni. Per i consumatori, l'era degli SSD estremamente economici potrebbe essere finita, per ora. I prezzi non torneranno ai livelli precedenti finché non entreranno in funzione grandi quantità di nuova capacità produttiva e il ritmo di crescita della domanda di IA non rallenterà gradualmente.





