Каков уровень отказов корпоративных SSD-накопителей?

Современные корпоративные SSD-накопители, как правило, имеют годовой показатель отказов в диапазоне от 0,3% и 0,6% в стандартных средах центров обработки данных, при этом высокопроизводительные корпоративные модели демонстрируют номинальные значения в диапазоне от 0,1% до 0,2%. Эти накопители по общему мнению быть более надежными, чем потребительские SSD-накопители и корпоративные жесткие диски, на протяжении всего срока службы, особенно в долгосрочный работа. В отличие от жестких дисков, частота отказов SSD остаются относительно стабильными с течением времени а не резко возрастать по мере старения оборудования.

Основные показатели надежности, характеризующие частоту отказов

Годовой коэффициент отказов (AFR) – показывает процент дисков в большом парке, выходящих из строя в течение одного полного года эксплуатации. Это наиболее практичный показатель для планирования мощностей и технического обслуживания центров обработки данных.

Среднее время между отказами (ВРЕМЯ НАРАБОТКИ НА ОТКАЗ) – представляет собой вероятностную оценку среднего времени наработки на отказ в большой совокупности устройств. Большинство корпоративных SSD имеют номинальное значение MTBF, равное от 2,0 до 2,5 миллиона часов, что соответствует теоретическому соотношению воздух-топливо (AFR) примерно от 0,35% до 0,44%.

Годовой коэффициент замены (ARR) – отслеживает долю дисков, физически заменяемых ежегодно. Этот показатель в значительной степени соответствует реальному показателю AFR, но также включает профилактическую замену, производимую до полного выхода диска из строя.

Данные о частоте отказов корпоративных SSD-накопителей в реальных условиях эксплуатации

Технические характеристики поставщика и полевые данные

  • Корпоративные SSD-накопители серии OSCOO OE имеют номинальное среднее время безотказной работы (MTBF) в диапазоне от 2,0 до 2,5 миллиона часов.
  • Корпоративные жесткие диски Seagate серии Exos (в серию входят как линейки продуктов на жестких дисках, так и на SSD) имеют номинальный коэффициент AFR, равный 0.44% и среднее время безотказной работы (MTBF) составляет 2,0 миллиона часов в официальных руководствах по эксплуатации продукции.
  • Union Memory UH812a/UH832a Производительность корпоративных SSD-накопителей стандарта PCIe 5.0 составляет AFR ≤ 0,35% и MTBF ≥ 2,5 млн часов.
  • Samsung PM1735 Корпоративные SSD-накопители NVMe имеют номинальное значение MTBF, равное 2,0 миллиона часов.

В целом по отрасли современные массовые корпоративные SSD-накопители стандартов SATA и NVMe, как правило, относятся к 0,3–0,61 TP6T AFR диапазон при эксплуатации в пределах номинальной нагрузки.

Линейка корпоративных SSD-накопителей OSCOO. Каков уровень отказов корпоративных SSD-накопителей?

Научные исследования в академической среде и промышленности

FAST ’20 исследование проанализировал данные из более 1,4 миллиона SSD-накопителей за 2,5 года, в крупномасштабной корпоративной системе хранения данных. Исследование показало, что среднегодовой коэффициент замены (ARR) по всему автопарку составил 0,221 TP6T, однако по отдельным моделям наблюдались значительные колебания — от 0,071 TP6T до 1,21 TP6T. В рамках исследования были рассмотрены накопители с различными типами памяти NAND (SLC, cMLC, eMLC и 3D TLC) от три производителя и 18 моделейОшибки SCSI были основной причиной замены дисков, на их долю приходилось около одной трети всех случаев замены.

Более ранние исторические данные крупнейших операторов облачных сервисов за период с 2014 по 2015 год свидетельствуют о более высоких показателях: Google сообщила о показателе AFR в диапазоне 1–2,51 TP6T для ранних флэш-накопителей, Microsoft зафиксировала показатель 1–21 TP6T по более чем миллиону SSD-накопителей, а Facebook сообщила о показателе AFR 1,331 TP6T для своего парка флэш-накопителей. Эти цифры включают устаревшие накопители и накопители, близкие по характеристикам к потребительским. CСуществующие бизнес-модели демонстрируют значительно более высокую эффективность чем те, что относятся к той эпохе.

Основные факторы, влияющие на показатели отказов

В отличие от жестких дисков (HDD), где основной причиной поломок является механический износ, на надежность твердотельных накопителей (SSD) влияют четыре основных фактора.

Технология NAND Flash. Различные типы флэш-памяти NAND отличаются по уровню встроенной надёжности. В целом, по степени надежности эти типы памяти располагаются в порядке убывания: SLC, eMLC/MLC, 3D TLC и QLC. Современная 3D-память TLC с коррекцией ошибок LDPC и усовершенствованной системой выравнивания износа обладает сократили разрыв в надежности с технологией MLC для большинства корпоративных сценариев использования. SSD-накопители с технологией QLC лучше подходят для рабочих нагрузок с преобладанием операций чтения и для хранения «холодных» данных из-за более низкой стойкости к записи.

Напишите «Нагрузка» и «Выносливость». Твердотельные накопители корпоративного класса оцениваются по Количество записей на диск в день (DWPD) , начиная от 1 DWPD для рабочих нагрузок с преобладанием операций чтения на Более 10 DWPD для приложений с интенсивной записью. При низкой нагрузке, Износ памяти NAND не является основной причиной выхода из строя большинства корпоративных SSD-накопителей. Большинство сбоев возникает из-за электроника контроллера, ошибки в прошивке или сбои в электропитании а не из-за износа циклов записи.

Условия эксплуатации. Высокие температуры ускоряют износ памяти NAND и изнашивание электронных компонентов. SSD-накопители корпоративного класса прошли испытания на работоспособность в диапазоне температур от 0 до 70 °C и включают в себя тепловое дросселирование защита. Защита от потери питания с помощью встроенных конденсаторов является стандартной функцией в моделях корпоративного класса и значительно снижает риск повреждения данных и внезапных сбоев, вызванных неожиданными перебоями в электроснабжении. Благодаря отсутствию движущихся частей SSD-накопители гораздо более устойчивый к вибрации и ударам, чем жесткие диски.

Качество контроллера и встроенного ПО. Контроллеры корпоративного уровня с расширенная коррекция ошибок, динамическое выравнивание износа и резервирование емкости значительно снизить риск сбоев. Дефекты прошивки являются одной из основных причин отказов на раннем этапе эксплуатации. Корпоративные SSD-накопители проходят более тщательная проверка и получить более длительная поддержка прошивки по сравнению с потребительскими моделями, что снижает риск выхода из строя в долгосрочной перспективе.

Сравнение надежности корпоративных SSD и корпоративных HDD

МетрикаСовременный корпоративный SSD-накопительКорпоративные жесткие диски SATA/SAS
Типичное соотношение «воздух-топливо» (AFR)0,3 – 0,61 TP6T0,45 – 1,61 TP6T
AFR через 5 лет~0,91 TP6T (плоский тренд)~3,51 TP6T (резко растёт)
Номинальное время безотказной работы (MTBF)2,0–2,5 млн часов1,0–1,2 млн часов
Доминирующий тип отказаВнезапный / катастрофическийПостепенный механический износ
Основной сдерживающий факторСрок службы записи (TBW)Календарный возраст и механический износ

При длительном развертывании пять лет и более, у корпоративных жестких дисков обычно наблюдается 3–4 раза более высокий уровень отказов по сравнению с корпоративными SSD того же возраста. Этот разрыв еще больше в с высокой частотой вибрации или высоким показателем IOPS среды.

滚动至顶部

Свяжитесь с нами

Заполните форму ниже, и мы свяжемся с вами в ближайшее время.

Продукт контактной формы