Moderne SSDs für den Unternehmensbereich weisen in der Regel eine jährliche Ausfallrate zwischen 0,3% und 0,6% in Standard-Rechenzentrumsumgebungen, wobei High-End-Modelle für Unternehmen Nennwerte von nur 0,1% bis 0,2% erreichen. Diese Laufwerke sind allgemein als… angesehen über ihre gesamte Lebensdauer hinweg zuverlässiger zu sein als SSDs für Endverbraucher und Festplatten für den Unternehmensbereich, insbesondere in langfristig Betrieb. Im Gegensatz zu HDDs sind die Ausfallraten von SSDs im Laufe der Zeit relativ stabil bleiben anstatt mit zunehmendem Alter der Hardware stark anzusteigen.
Wichtige Zuverlässigkeitskennzahlen zur Ausfallrate
Annualisierte Ausfallrate (AFR) – gibt den prozentualen Anteil der Laufwerke in einem großen Bestand an, die im Laufe eines gesamten Betriebsjahres ausfallen. Dies ist die praktischste Kennzahl für die Kapazitäts- und Wartungsplanung in Rechenzentren.
Mittlere Zeit zwischen Ausfällen (MTBF) – ist eine probabilistische Schätzung der durchschnittlichen Betriebszeit zwischen Ausfällen in einer großen Population. Die meisten SSDs für den Unternehmensbereich weisen eine Nenn-MTBF von 2,0 bis 2,5 Millionen Stunden, was einem theoretischen Luft-Kraftstoff-Verhältnis von etwa 0,35% bis 0,44% entspricht.
Jährliche Erneuerungsrate (ARR) – erfasst den Anteil der Laufwerke, die jedes Jahr physisch ausgetauscht werden. Dieser Wert entspricht weitgehend der tatsächlichen Ausfallrate (AFR), umfasst jedoch auch proaktive Austausche, die vorgenommen werden, bevor ein Laufwerk vollständig ausfällt.
Daten zur Ausfallrate von Enterprise-SSDs im Praxiseinsatz
Herstellerspezifikationen und Felddaten
- Enterprise-SSDs der OSCOO OE-Serie weisen eine nominelle MTBF zwischen 2,0 und 2,5 Millionen Stunden auf.
- Enterprise-Festplatten der Seagate Exos-Serie (Die Serie umfasst sowohl HDD- als auch SSD-Produktlinien) weisen einen Nenn-AFR von 0.44% und eine MTBF von 2,0 Millionen Stunden in offiziellen Produkthandbüchern.
- Union Memory UH812a/UH832a PCIe 5.0-Enterprise-SSDs sind ausgelegt für AFR ≤ 0,35% und MTBF ≥ 2,5 Millionen Stunden.
- Samsung PM1735 NVMe-SSDs für den Unternehmensbereich haben eine Nenn-MTBF von 2,0 Millionen Stunden.
Branchenweit fallen moderne, gängige SATA- und NVMe-SSDs für den Unternehmensbereich im Allgemeinen in den Bereich der 0,3–0,61 TP6T AFR Bereich, sofern sie innerhalb ihrer Nennlastgrenzen betrieben werden.
Forschung an Hochschulen und in der Industrie
A FAST ’20 Studie ausgewertete Daten aus über 1,4 Millionen SSDs über einen Zeitraum von 2,5 Jahren, in einem groß angelegten Unternehmensspeichersystem. Die Studie ergab, dass Die durchschnittliche jährliche Austauschrate (ARR) für die gesamte Flotte betrug 0,221 TP6T, wobei jedoch große Unterschiede zwischen den einzelnen Modellen bestanden, die von 0,071 TP6T bis 1,21 TP6T reichten.. Die Studie umfasste Laufwerke mit verschiedenen NAND-Typen (SLC, cMLC, eMLC und 3D-TLC) von drei Hersteller und 18 Modelle. SCSI-Fehler waren der Hauptgrund für den Austausch von Laufwerken und machten etwa ein Drittel aller Austauschvorgänge aus.
Ältere historische Daten großer Cloud-Anbieter aus den Jahren 2014 und 2015 weisen höhere Werte auf: Google meldete für frühe Flash-Laufwerke eine AFR von 1–2,51 TP6T, Microsoft verzeichnete bei über einer Million SSDs Werte von 1–21 TP6T und Facebook gab für seine Flash-Flotte eine AFR von 1,331 TP6T an. Diese Zahlen umfassen auch ältere Laufwerke sowie solche, die fast dem Consumer-Standard entsprechen. CAktuelle Geschäftsmodelle schneiden deutlich besser ab als jene aus jener Zeit.
Wichtige Faktoren, die die Ausfallraten beeinflussen
Im Gegensatz zu Festplatten (HDDs), bei denen mechanischer Verschleiß die Ursache für die meisten Ausfälle ist, wird die Zuverlässigkeit von SSDs von vier Hauptfaktoren bestimmt.
NAND-Flash-Technologie. Verschiedene Arten von NAND-Flash-Speichern weisen unterschiedliche inhärente Zuverlässigkeitsgrade auf. Im Allgemeinen lässt sich die Zuverlässigkeit von der höchsten zur niedrigsten wie folgt einstufen: SLC, eMLC/MLC, 3D-TLC und QLC. Moderne 3D-TLC-Speicher mit LDPC-Fehlerkorrektur und fortschrittlichem Wear-Leveling verfügen über die Zuverlässigkeitslücke verringert mit MLC für die meisten Anwendungsfälle in Unternehmen. QLC-SSDs eignen sich aufgrund ihrer geringeren Schreiblebensdauer besser für leseintensive Workloads und Cold-Storage-Anwendungen.
Schreibe „Belastung“ und „Ausdauer“. Enterprise-SSDs werden nach folgenden Kriterien bewertet: Schreibvorgänge pro Tag (DWPD) , die von 1 DWPD für leseintensive Workloads zu Über 10 DWPD für schreibintensive Anwendungen. Bei unterbewerteten Arbeitsaufwänden, Der Verschleiß der NAND-Speicher ist bei den meisten Enterprise-SSDs nicht die Hauptursache für Ausfälle.. Die meisten Fehler sind auf Steuerelektronik, Firmware-Fehler oder Stromausfälle anstatt erschöpfter Schreibzyklen.
Betriebsbedingungen. Hohe Temperaturen beschleunigen den Verschleiß von NAND-Speichern und die Alterung elektronischer Bauteile. Enterprise-SSDs sind für den Betrieb bei Temperaturen von 0–70 °C validiert und umfassen thermische Drosselung Schutz. Stromausfallschutz durch integrierte Kondensatoren ist bei Enterprise-Modellen serienmäßig und reduziert Datenverluste sowie plötzliche Ausfälle aufgrund unerwarteter Stromausfälle erheblich. Da SSDs keine beweglichen Teile enthalten, sind sie weitaus widerstandsfähiger gegenüber Vibrationen und Stößen widerstandsfähiger als Festplatten.
Qualität von Steuerungen und Firmware. Controller der Enterprise-Klasse mit Erweiterte Fehlerkorrektur, dynamischer Verschleißausgleich und Überprovisionierung das Ausfallrisiko erheblich verringern. Firmware-Fehler sind eine der Hauptursachen für Ausfälle in der Anfangsphase. Enterprise-SSDs werden eine strengere Validierung und erhalten längere Firmware-Unterstützung als Consumer-Modelle, was das langfristige Ausfallrisiko senkt.
Vergleich der Zuverlässigkeit von Enterprise-SSDs und Enterprise-HDDs
| Metrisch | Moderne SSD für Unternehmen | SATA/SAS-Festplatten für den Unternehmensbereich |
|---|---|---|
| Typisches AFR | 0,3 – 0,61 TP6T | 0,45 – 1,61 TP6T |
| AFR nach 5 Jahren | ~0,91 TP6T (seitwärts tendierend) | ~3,51 TP6T (stark steigend) |
| Nenn-MTBF | 2,0 – 2,5 Mio. Stunden | 1,0 – 1,2 Mio. Stunden |
| Vorherrschende Ausfallart | Plötzlich / katastrophal | Allmählicher mechanischer Verschleiß |
| Hauptlimitierender Faktor | Schreibausdauer (TBW) | Kalenderalter und mechanischer Verschleiß |
Bei langfristigen Einsätzen von fünf Jahre oder mehr, Enterprise-Festplatten weisen in der Regel folgende Eigenschaften auf 3 bis 4 Mal höhere Ausfallraten als gleich alte SSDs für den Unternehmensbereich. Der Unterschied ist sogar noch größer bei hohe Vibrationsbelastung oder hohe IOPS Umgebungen.





