Qual é a taxa de falhas dos SSDs empresariais?

Os SSDs empresariais modernos apresentam, normalmente, uma taxa de falha anual entre 0,3% e 0,6% em ambientes de centro de dados padrão, com modelos empresariais topo de gama a atingirem valores nominais tão baixos quanto 0,1% a 0,2%. Estas unidades são amplamente considerado ser mais fiáveis do que os SSD para consumidores e os discos rígidos empresariais ao longo de toda a sua vida útil, especialmente em a longo prazo funcionamento. Ao contrário dos discos rígidos (HDD), as taxas de avaria dos SSD permanecem relativamente estáveis ao longo do tempo em vez de aumentar acentuadamente à medida que o hardware envelhece.

Principais métricas de fiabilidade relativas à taxa de falhas

Taxa de falha anualizada (AFR) – indica a percentagem de unidades de disco numa grande frota que apresentam falhas ao longo de um ano completo de funcionamento. Esta é a métrica mais prática para o planeamento da capacidade e da manutenção dos centros de dados.

Tempo médio entre falhas (MTBF) – é uma estimativa probabilística do tempo médio de funcionamento entre falhas numa grande população. A maioria dos SSD empresariais apresenta um MTBF nominal de 2,0 a 2,5 milhões de horas, o que corresponde a uma AFR teórica de cerca de 0,35% a 0,44%.

Taxa de Substituição Anual (ARR) – acompanha a percentagem de unidades substituídas fisicamente todos os anos. Este valor corresponde de perto à taxa de falhas anual (AFR) real, mas inclui também as substituições proativas efetuadas antes de uma unidade falhar completamente.

Dados sobre a taxa de falhas de SSD empresariais em condições reais

Especificações do fornecedor e dados de campo

  • SSD empresariais da série OSCOO OE têm um MTBF nominal que varia entre 2,0 e 2,5 milhões de horas.
  • Unidades empresariais da série Exos da Seagate (a série inclui linhas de produtos tanto de HDD como de SSD) apresentam um AFR nominal de 0.44% e um MTBF de 2,0 milhões de horas nos manuais oficiais dos produtos.
  • Union Memory UH812a/UH832a Os SSDs empresariais PCIe 5.0 têm uma velocidade nominal de AFR ≤ 0,35% e MTBF ≥ 2,5 milhões de horas.
  • Samsung PM1735 Os SSDs NVMe empresariais têm um MTBF nominal de 2,0 milhões de horas.

Em todo o setor, os SSDs SATA e NVMe empresariais modernos e mais comuns situam-se geralmente dentro da 0,3–0,61 TP6T AFR intervalo, quando operados dentro dos limites de carga nominal.

Linha de produtos SSD empresariais OSCOO: Qual é a taxa de falhas dos SSD empresariais?

Investigação académica e industrial

FAST ’20 estudo analisou dados provenientes de mais de 1,4 milhões de SSDs, ao longo de 2,5 anos, num sistema de armazenamento empresarial de grande escala. O estudo concluiu que a taxa média anual de substituição (ARR) em toda a frota foi de 0,22%, mas com uma grande variação entre os diferentes modelos, que oscilou entre 0,07% e 1,2%. O estudo abrangeu unidades com vários tipos de memória NAND (SLC, cMLC, eMLC e 3D TLC) da três fabricantes e 18 modelosOs erros SCSI foram a principal causa das substituições de unidades, representando cerca de um terço do total de substituições.

Dados históricos mais antigos dos principais operadores de nuvem, relativos ao período entre 2014 e 2015, revelam taxas mais elevadas: A Google registou uma taxa de falhas anual (AFR) de 1–2,51 TP6T para as primeiras unidades flash, a Microsoft registou 1–21 TP6T em mais de um milhão de SSDs e o Facebook registou uma AFR de 1,331 TP6T para o seu parque de unidades flash. Estes números incluem unidades mais antigas e de nível quase de consumo. COs modelos empresariais atuais apresentam um desempenho substancialmente melhor do que os daquela época.

Fatores-chave que influenciam as taxas de falha

Ao contrário dos discos rígidos (HDD), em que o desgaste mecânico é a principal causa de avarias, a fiabilidade dos SSD é determinada por quatro fatores principais.

Tecnologia NAND Flash. Os diferentes tipos de memória flash NAND apresentam níveis de fiabilidade inerentes distintos. Em geral, a fiabilidade classifica-se, da mais elevada para a mais baixa, como SLC, eMLC/MLC, 3D TLC e QLC. A tecnologia TLC 3D moderna, com correção de erros LDPC e nivelamento de desgaste avançado, possui reduziu a diferença em termos de fiabilidade com MLC para a maioria dos casos de utilização empresariais. Os SSDs QLC são mais adequados para cargas de trabalho com grande volume de leituras e para armazenamento inativo, devido à sua menor resistência à gravação.

Carga de trabalho e resistência. Os SSDs empresariais são classificados por Gravações por dia (DWPD) , variando entre 1 DWPD para cargas de trabalho com grande volume de leituras para Mais de 10 DWPD para aplicações com grande volume de gravações. No caso de cargas de trabalho subestimadas, O desgaste da memória NAND não é a principal causa de avaria na maioria dos SSDs empresariais. A maioria das falhas deve-se a componentes eletrónicos do controlador, erros de firmware ou falhas de alimentação em vez de ciclos de gravação esgotados.

Condições de funcionamento. As altas temperaturas aceleram o desgaste da memória NAND e a degradação dos componentes eletrónicos. Os SSDs empresariais são testados para funcionamento entre 0 e 70 °C e incluem estrangulamento térmico proteção. Proteção contra quedas de tensão através de condensadores integrados é uma característica padrão nos modelos empresariais e reduz significativamente a corrupção de dados e as falhas repentinas causadas por cortes de energia inesperados. Sem peças móveis, os SSDs são muito mais resistente à vibração e aos choques do que os discos rígidos (HDD).

Qualidade do controlador e do firmware. Controladores de nível empresarial com correção avançada de erros, nivelamento dinâmico do desgaste e sobrealocação reduzir significativamente o risco de falha. Os defeitos de firmware são uma das principais causas de avarias precoces. Os SSDs empresariais são submetidos a uma validação mais rigorosa e receber suporte prolongado ao firmware em comparação com os modelos destinados ao consumidor, o que reduz o risco de avaria a longo prazo.

Comparação de fiabilidade entre SSD e HDD empresariais

MétricaSSD empresarial modernoDisco rígido SATA/SAS empresarial
AFR típico0,3 – 0,61 TP6T0,45 – 1,61 TP6T
AFR após 5 anos~0,91 TP6T (tendência lateral)~3,51 TP6T (em forte subida)
MTBF nominal2,0 – 2,5 milhões de horas1,0 – 1,2 milhões de horas
Modo de falha dominanteRepentino / catastróficoDesgaste mecânico gradual
Fator limitante principalCapacidade de gravação (TBW)Idade cronológica e desgaste mecânico

Em implementações de longo prazo de cinco anos ou mais, os discos rígidos empresariais apresentam normalmente 3 a 4 vezes taxas de falha mais elevadas do que as dos SSD empresariais com a mesma idade. A diferença é ainda maior em de alta vibração ou alto IOPS ambientes.

Deslocar para o topo

Contacte-nos

Preencha o formulário abaixo e entraremos em contacto em breve.

Formulário de contacto Produto