Os centros de dados de IA não utilizam exclusivamente SSDs ou HDDs. Normalmente, eles implantam os dois tipos de unidades de maneira híbrida. Os SSD, com o seu excelente desempenho, lidam com as principais cargas de trabalho em operações de IA que exigem alta velocidade, servindo como o principal meio para desbloquear o poder de computação. Os HDD, com base na sua grande capacidade e baixo custo, assumem o armazenamento e o arquivo de grandes quantidades de dados. Os dois trabalham em conjunto para formar um sistema de armazenamento completo.
Porque é que a implementação híbrida é necessária
Os centros de dados de IA adoptam a implantação híbrida de SSDs e HDDs principalmente porque os dois têm pontos fortes claramente complementares em termos de desempenho e custo. As SSD não têm partes móveis e lêem e escrevem dados inteiramente através de sinais electrónicos, o que as torna extremamente rápidas. A sua latência é normalmente medida em microssegundos e o seu desempenho de leitura/escrita aleatória (IOPS) é centenas ou mesmo milhares de vezes superior à dos HDD. Estas caraterísticas permitem que os SSD satisfaçam os requisitos de elevada velocidade de acesso aos dados para formação e inferência de IA. Os HDD, pelo contrário, dependem de cabeças magnéticas para ler e escrever dados em discos giratórios. Devido à sua estrutura mecânica, a sua latência é medida em milissegundos e o seu desempenho de leitura/escrita aleatória é muito inferior ao das SSD. A sua vantagem reside no custo.
| Caraterística | SSD | HDD |
|---|---|---|
| Princípio de funcionamento | Baseado em memória flash, sem partes móveis | A cabeça magnética lê/escreve em discos giratórios, com peças móveis envolvidas |
| Latência | Nível de microssegundos | Nível de milissegundos |
| Desempenho de leitura/escrita aleatória | Muito elevado (IOPS centenas de vezes superior ao HDD) | Relativamente baixo |
| Custo por TB | Aproximadamente 10 a 20 vezes mais do que o HDD | Relativamente baixo |
| Capacidade máxima por unidade | Atingir o nível 128TB-245TB | Alcançando 32TB e mais (tecnologia HAMR) |
| Eficiência energética | Potência por TB muito inferior à do HDD | Giro contínuo, consumo de energia relativamente mais elevado |
De acordo com Dados da VDURA a partir do primeiro trimestre de 2026, o custo por unidade de capacidade dos SSD empresariais QLC de 30 TB atingiu 22,6 vezes o dos HDD com a mesma capacidade. O preço das SSD empresariais TLC de 30 TB aumentou de cerca de $3,062 to sobre $17.500 no último ano, enquanto os preços dos HDD aumentaram apenas cerca de 35% no mesmo período. Esta diferença torna as soluções SSD puras cada vez mais inacessíveis.
A modelação da VDURA de uma configuração típica de centro de dados mostra que, ao longo de um ciclo de vida de três anos, o custo total de propriedade de um sistema de armazenamento híbrido é de aproximadamente $7,31 milhões, enquanto um sistema SSD puro custa aproximadamente $31,06 milhões. O custo a três anos da solução híbrida é cerca de um quarto do custo da solução SSD pura. Em suma, as SSDs fornecem velocidade, enquanto os HDDs fornecem capacidade e controlo de custos. Ambos têm um valor insubstituível, pelo que a implementação híbrida é essencialmente uma escolha inevitável para os centros de dados actuais.
Lógica de seleção de armazenamento para operações centrais de IA
A fase de preparação dos dados processa os dados em bruto. Esta fase envolve principalmente leituras sequenciais em grande escala, que não requerem um elevado desempenho de leitura/escrita aleatória, mas exigem uma capacidade significativa. A prática da indústria adopta sobretudo soluções de armazenamento baseadas em HDD, complementadas por alguma cache SSD para melhorar a velocidade de acesso aos dados quentes.
A fase de treino do modelo tem os requisitos de desempenho de armazenamento mais elevados. Todo o processo requer a leitura contínua de amostras de treino maciças e a escrita frequente de ficheiros de pontos de verificação de modelos, criando exigências de débito de dados extremamente elevadas. Se os HDD fossem utilizados como armazenamento primário, a sua latência inerente faria com que o fornecimento de dados ficasse aquém do cálculo da GPU, levando diretamente a ciclos de cálculo ociosos e a uma queda significativa na utilização do hardware. Por conseguinte, em clusters de formação, os SSD NVMe são implementados localmente em servidores GPU e em clusters de armazenamento partilhado. Tecnologias como RDMA e NVMe-oF são utilizadas para criar sistemas de ficheiros paralelos, fornecendo um fluxo contínuo de dados para clusters multi-GPU.
A fase de serviço da inferência tem dois requisitos essenciais: baixa latência de resposta e elevada capacidade de concorrência. As principais aplicações de modelos de linguagem de grande dimensão e os serviços de geração aumentada por recuperação (RAG) geram um grande número de pedidos de cache KV e de recuperação de vectores. Esses tipos de acesso a dados são altamente aleatórios e sensíveis à latência e, portanto, devem ser executados em SSDs. Os pesos do modelo e os bancos de dados vetoriais usados na inferência também são totalmente implantados em SSDs NVMe para garantir um tempo rápido até o primeiro token e a estabilidade geral do serviço. Os HDDs desempenham apenas um papel de apoio na inferência, armazenando registos históricos, bases de dados de conhecimento acedidas com pouca frequência e ficheiros de cópia de segurança - não participam em serviços front-end em tempo real.
Arquitetura de armazenamento em vários níveis
Atualmente, todos os data centers de IA maduros adotam uma arquitetura de armazenamento em camadas. Os dados são divididos em três camadas - quente, morna e fria - com base na frequência de acesso e nos requisitos de desempenho, e a configuração do hardware muda de acordo para equilibrar o desempenho e o custo.
- O nível quente é a parte da arquitetura com maior desempenho, incluindo memória, memória GPU de elevada largura de banda e SSDs NVMe locais em servidores. A sua capacidade total representa apenas 5% a 20% do espaço total de armazenamento. Este nível armazena pesos de modelos, caches em tempo real e dados de treino frequentemente utilizados. Determina diretamente a eficiência da GPU e é a ligação central que garante o bom funcionamento das cargas de trabalho de IA.
- A camada quente normalmente usa SSDs QLC NVMe de alta capacidade ou HDDs de alto desempenho e, em alguns casos, matrizes de HDD aceleradas por cache SSD. Armazena dados moderadamente acedidos, como conjuntos de dados limpos e ficheiros de modelos frequentemente utilizados, estabelecendo um equilíbrio entre desempenho, capacidade e custo.
- O nível frio ocupa mais de 80% da capacidade de armazenamento de um centro de dados. O seu hardware principal consiste em matrizes de HDD empresariais; alguns clusters muito grandes também incorporam bibliotecas de fitas. É dedicado ao armazenamento de dados frios raramente acedidos, tais como corpora em bruto, dados expirados e cópias de segurança completas, maximizando o controlo sobre os custos globais de implementação.
Estado da indústria e tendências tecnológicas
Em termos de quota de capacidade global, os HDD continuam a representar cerca de 80% da capacidade total de armazenamento nos centros de dados de IA actuais, servindo de base para dados maciços. Embora os SSDs sejam excelentes em termos de desempenho, a sua quota de capacidade permanece relativamente limitada devido a restrições de custos. Olhando para as tendências de crescimento, o boom da indústria de IA está a impulsionar a procura de ambos os tipos de produtos de armazenamento. No entanto, a taxa de crescimento anual composta para SSDs empresariais é muito superior ao dos HDD, o que reflecte o papel essencial do armazenamento de elevado desempenho em cenários de IA.
À medida que a tecnologia de memória flash evolui, as SSD QLC de grande capacidade estão a tornar-se mais generalizadas e a invadir gradualmente os mercados de dados quentes que anteriormente pertenciam aos HDD. Alguns dados de acesso moderado estão a começar a ser transferidos para o armazenamento SSD. No entanto, a longo prazo, os HDD não serão completamente substituídos. Em cenários de arquivamento de dados frios à escala de petabytes ou exabytes, os HDD continuam a ser insubstituíveis devido ao seu custo por unidade de capacidade, ao passo que as SSD - limitadas pelas suas caraterísticas físicas e preço - dificilmente conseguirão assumir totalmente o armazenamento de arquivo de grande capacidade. A coexistência a longo prazo dos dois tipos de hardware, trabalhando em conjunto de forma escalonada, será o modelo de armazenamento principal para centros de dados de IA no futuro.
SSDs e HDDs não são alternativas concorrentes; são componentes complementares na arquitetura de armazenamento dos data centers de IA. As SSDs baseadas em NVMe lidam com as cargas de trabalho de núcleo de alto desempenho, permitindo que a computação de IA seja totalmente liberada. Os HDDs empresariais mantêm a linha de grande capacidade e baixo custo, acomodando as necessidades de armazenamento de dados massivos. O modelo de implementação híbrido e em camadas equilibra o desempenho, a capacidade e o custo - os três factores essenciais. É a solução de armazenamento mais razoável para centros de dados de IA atualmente e continuará a sê-lo num futuro próximo.





