Gli SSD aziendali moderni presentano in genere un tasso di guasto annuo compreso tra 0,3% e 0,6% negli ambienti standard dei data center, con i modelli aziendali di fascia alta che raggiungono valori nominali compresi tra 0,1% e 0,2%. Queste unità sono ampiamente considerato di essere più affidabili degli SSD destinati al mercato consumer e dei dischi rigidi aziendali per tutta la loro durata di vita, in particolare in a lungo termine funzionamento. A differenza degli HDD, i tassi di guasto degli SSD rimangono relativamente stabili nel tempo anziché aumentare drasticamente con l'invecchiamento dell'hardware.
Indicatori chiave di affidabilità relativi al tasso di guasto
Tasso di fallimento annualizzato (AFR) – indica la percentuale di unità che, in una flotta di grandi dimensioni, subiscono un guasto nel corso di un intero anno di funzionamento. Si tratta dell’indicatore più pratico per la pianificazione della capacità e della manutenzione dei data center.
Tempo medio tra i guasti (MTBF) – è una stima probabilistica del tempo medio di funzionamento tra i guasti su un ampio campione. La maggior parte degli SSD aziendali presenta un MTBF nominale pari a Da 2,0 a 2,5 milioni di ore, il che corrisponde a un rapporto aria-carburante (AFR) teorico compreso tra circa 0,35% e 0,44%.
Tasso di sostituzione annuale (ARR) – tiene traccia della percentuale di unità sostituite fisicamente ogni anno. Questo dato corrisponde sostanzialmente all’AFR effettivo, ma include anche le sostituzioni preventive effettuate prima che un’unità smetta completamente di funzionare.
Dati reali sul tasso di guasto degli SSD aziendali
Specifiche del fornitore e dati sul campo
- SSD aziendali della serie OSCOO OE hanno un MTBF nominale compreso tra 2,0 e 2,5 milioni di ore.
- Dischi rigidi aziendali della serie Exos di Seagate (la serie comprende sia la linea di prodotti HDD che quella SSD) hanno un AFR nominale pari a 0.44% e un MTBF pari a 2,0 milioni di ore nei manuali ufficiali dei prodotti.
- Union Memory UH812a/UH832a Gli SSD aziendali PCIe 5.0 hanno una velocità nominale di AFR ≤ 0,35% e MTBF ≥ 2,5 milioni di ore.
- Samsung PM1735 Gli SSD NVMe aziendali hanno un MTBF nominale pari a 2,0 milioni di ore.
In tutto il settore, i moderni SSD SATA e NVMe di fascia mainstream per le aziende rientrano generalmente nella 0,3–0,61 TP6T AFR intervallo, purché vengano utilizzati entro i limiti di carico nominali.
Ricerca accademica e industriale
A FAST ’20 studio ha analizzato i dati provenienti da oltre 1,4 milioni di SSD, in un arco di 2,5 anni, in un sistema di archiviazione aziendale su larga scala. Lo studio ha rilevato che il tasso medio annuo di sostituzione (ARR) dell'intera flotta è stato pari a 0,22%, ma con ampie variazioni tra i singoli modelli, che vanno da 0,07% a 1,2%. Lo studio ha preso in esame unità dotate di vari tipi di memoria NAND (SLC, cMLC, eMLC e 3D TLC) prodotte da tre produttori e 18 modelli. Gli errori SCSI sono stati la causa principale delle sostituzioni delle unità, rappresentando circa un terzo del totale delle sostituzioni.
I dati storici più datati dei principali operatori cloud, relativi al periodo tra il 2014 e il 2015, mostrano valori più elevati: Google ha riportato un AFR compreso tra 1 e 2,51 TP6T per le prime unità flash, Microsoft ha registrato valori tra 1 e 21 TP6T su oltre un milione di SSD, mentre Facebook ha riportato un AFR di 1,331 TP6T per il proprio parco di unità flash. Questi dati includono unità più datate e di livello quasi consumer. CGli attuali modelli aziendali registrano risultati nettamente migliori rispetto a quelli di quell’epoca.
Fattori chiave che influenzano i tassi di guasto
A differenza degli HDD, in cui l'usura meccanica è la causa principale dei guasti, l'affidabilità degli SSD dipende da quattro fattori principali.
Tecnologia NAND Flash. I diversi tipi di memoria flash NAND presentano livelli di affidabilità intrinseca diversi. In generale, l'affidabilità varia, in ordine decrescente, da SLC a eMLC/MLC, 3D TLC e QLC. Il moderno TLC 3D con correzione degli errori LDPC e livellamento avanzato dell'usura offre ha ridotto il divario in termini di affidabilità con MLC per la maggior parte dei casi d'uso aziendali. Gli SSD QLC sono più adatti a carichi di lavoro con un'elevata attività di lettura e all'archiviazione a basso utilizzo, a causa della loro minore resistenza alla scrittura.
Scrivi "Carico di lavoro" e "Resistenza". Gli SSD aziendali sono classificati in base a Scritture su disco al giorno (DWPD) , che vanno da 1 DWPD per carichi di lavoro con un'elevata intensità di letture a Oltre 10 DWPD per applicazioni con un carico di scrittura elevato. In caso di carichi di lavoro sottostimati, L'usura della memoria NAND non è la causa principale di guasto per la maggior parte degli SSD aziendali. La maggior parte dei guasti deriva da componenti elettronici del controller, errori del firmware o problemi di alimentazione piuttosto che i cicli di scrittura esauriti.
Condizioni operative. Le temperature elevate accelerano l'usura delle memorie NAND e il deterioramento dei componenti elettronici. Gli SSD aziendali sono certificati per il funzionamento a temperature comprese tra 0 e 70 °C e includono strozzatura termica protezione. Protezione contro le interruzioni di corrente tramite condensatori integrati è di serie sui modelli aziendali e riduce notevolmente il rischio di danneggiamento dei dati e di guasti improvvisi causati da interruzioni di corrente impreviste. Privi di parti mobili, gli SSD sono molto più resistente alle vibrazioni e agli urti rispetto agli HDD.
Qualità del controller e del firmware. Controller di livello aziendale con correzione avanzata degli errori, livellamento dinamico dell'usura e over-provisioning ridurre in modo significativo il rischio di guasti. I difetti del firmware sono una delle principali cause di guasti nei primi tempi di funzionamento. Gli SSD aziendali vengono sottoposti a una validazione più rigorosa e ricevere supporto più a lungo del firmware rispetto ai modelli destinati al mercato consumer, il che riduce il rischio di guasti a lungo termine.
Confronto tra l'affidabilità degli SSD aziendali e quella degli HDD aziendali
| Metrico | SSD aziendali di ultima generazione | Dischi rigidi SATA/SAS per aziende |
|---|---|---|
| AFR tipico | 0,3 – 0,61 TP6T | 0,45 – 1,61 TP6T |
| AFR dopo 5 anni | ~0,91 TP6T (andamento piatto) | ~3,51 TP6T (in forte aumento) |
| MTBF nominale | 2,0 – 2,5 milioni di ore | 1,0 – 1,2 milioni di ore |
| Modalità di guasto dominante | Improvviso / catastrofico | Usura meccanica graduale |
| Fattore limitante principale | Resistenza di scrittura (TBW) | Età anagrafica e usura meccanica |
Nelle implementazioni a lungo termine di cinque anni o più, gli HDD aziendali in genere presentano da 3 a 4 volte tassi di guasto più elevati rispetto agli SSD aziendali della stessa età. Il divario è ancora più ampio in ad alta vibrazione o ad alto numero di IOPS ambienti.





