A IA está a fazer subir os preços dos SSD em todo o mundo, e a principal razão é um forte desequilíbrio entre a procura em alta e os limites estruturais da oferta. As aplicações de IA que abrangem toda a cadeia, como o treino de grandes modelos linguísticos, a inferência de IA e a geração aumentada por recuperação, criaram uma procura de SSD por parte das empresas muito superior à do mercado de consumo tradicional. As compras em grande escala por parte de fornecedores de serviços na nuvem e empresas de IA estão a esgotar rapidamente a capacidade de produção de memória flash NAND. Do lado da oferta, os fabricantes de armazenamento estão a redirecionar a capacidade, em primeiro lugar, para produtos empresariais com margens mais elevadas. Ao mesmo tempo, a expansão da HBM, a escassez de DRAM e os acordos de fornecimento a longo prazo reduzem ainda mais a capacidade disponível para os SSD de consumo. Acrescente-se a isso o longo prazo de produção das pastilhas NAND — a nova capacidade não consegue colmatar a lacuna rapidamente — e o resultado é uma oferta escassa e preços em alta para os consumidores comuns.
A formação em IA e a inferência impulsionam o aumento da procura de SSD
A procura de IA por SSDs não se limita a uma única parte do setor. Abrange toda a cadeia, desde o desenvolvimento de modelos até à sua aplicação no mundo real. Duas áreas-chave — a formação de LLM e a inferência de IA com geração aumentada por recuperação (RAG) — estão a criar uma procura de armazenamento muito superior à que o mercado de consumo tradicional alguma vez gerou, uma ao suportar a infraestrutura informática e a outra ao alimentar serviços diários contínuos.
A formação em LLM impulsiona uma enorme procura por SSD
O treino de modelos de linguagem de grande dimensão é atualmente a maior e mais urgente fonte de procura de SSD. A lógica subjacente é simples: as empresas precisam de armazenamento rápido que acompanhe os seus clusters de GPU, que podem custar dezenas ou mesmo centenas de milhões de dólares. Um armazenamento lento deixaria estas GPUs dispendiosas inativas, desperdiçando enormes quantias de dinheiro. O treino de um modelo de IA em grande escala requer o processamento de dezenas de petabytes de texto, imagens e outros dados mistos. Estes dados têm de ser armazenados em SSDs rápidos para suportar as leituras aleatórias necessárias durante o treino.
O processo de treino, que se prolonga por meses, também exige gravações frequentes do progresso do modelo para evitar a perda de dados, o que coloca grandes exigências à capacidade e à velocidade de gravação dos SSD. Os LLMs modernos são treinados em clusters distribuídos com milhares ou mesmo dezenas de milhares de GPUs. Cada servidor com GPU necessita de muitos SSD locais para armazenar cópias de dados e resultados intermédios, o que faz com que a procura total de armazenamento aumente drasticamente. Para as empresas de IA, o custo de adicionar SSDs é insignificante em comparação com as perdas diárias decorrentes de GPUs ociosas. Por isso, equipam cada servidor com o maior número possível de SSDs de alta velocidade, consumindo rapidamente a capacidade global de produção de SSDs.
A inferência de IA e a RAG impulsionam um crescimento sustentado e generalizado da procura
Se o treino de grandes modelos linguísticos representa um impulso concentrado e de curto prazo na procura, a inferência de IA e as aplicações RAG constituem um motor de crescimento mais abrangente e duradouro. A IA saiu dos laboratórios de investigação e passou a fazer parte do quotidiano. Milhares de milhões de pedidos todos os dias — para chat com IA, geração de imagens e pesquisa inteligente — exigem que os modelos de IA (muitas vezes com centenas de gigabytes) carreguem rapidamente para respostas instantâneas. Um armazenamento lento arruinaria a experiência do utilizador.
Entretanto, a tecnologia RAG, amplamente utilizada pelas empresas, armazena enormes volumes de documentos e dados sob a forma de vetores. Cada consulta precisa de encontrar rapidamente informações correspondentes entre milhões de entradas vetoriais, uma tarefa que apenas os SSDs rápidos conseguem realizar. Ao contrário do treino, a inferência e o RAG funcionam 24 horas por dia, 7 dias por semana, como serviços regulares. Desde assistentes pessoais de IA a sistemas inteligentes empresariais, a implementação está a crescer exponencialmente. Os fornecedores de serviços na nuvem e as empresas dão prioridade ao desempenho do armazenamento para manter os seus serviços competitivos, pelo que a procura de inferência continua a consumir a capacidade de SSD restante a nível mundial.
Em suma, a formação esgota rapidamente a capacidade existente através de compras avultadas e concentradas, enquanto a inferência aumenta progressivamente a procura total através de uma utilização generalizada e contínua. Em conjunto, estas duas vertentes alteraram profundamente a estrutura da procura no mercado dos SSD e tornaram o armazenamento de alta velocidade um recurso essencial na indústria da IA.
Contracção estrutural do lado da oferta
A explosão da procura já exerceu uma enorme pressão sobre a capacidade global de NAND. Além disso, vários fatores estruturais do lado da oferta estão a reduzir ainda mais o espaço de produção para SSDs de consumo, agravando ainda mais o desequilíbrio entre a oferta e a procura. Desde as prioridades de lucro até às alterações no layout de produção, dos modelos de parceria industrial às regras do ciclo de fabrico, todas as partes do sistema estão a inclinar-se para os casos de utilização de IA empresarial — e a pressão acaba por recair sobre o mercado de consumo.
Margens mais elevadas levam os fabricantes a dar prioridade aos SSD empresariais para IA
O boom da IA gerou uma enorme procura por centros de dados e SSDs empresariais, e também aumentou a diferença de lucros entre as linhas de produtos. SSD empresariais concebidos para IA Os servidores e os fornecedores de serviços na nuvem apresentam preços unitários e margens de lucro muito mais elevados do que os SSDs destinados ao consumidor comum. A mesma capacidade de uma pastilha NAND gera um lucro várias vezes superior quando utilizada em produtos empresariais. Com a produção global limitada, os principais fabricantes de armazenamento estão a direcionar a maior parte da capacidade NAND de gama alta, em primeiro lugar, para encomendas de SSDs destinados a empresas e centros de dados. Os SSDs para consumidores ficam a disputar a pequena quantidade de capacidade restante. Esta oferta cada vez mais escassa faz subir diretamente os preços de retalho para os consumidores.
A produção de HBM retira capacidade da memória NAND Flash
À medida que o setor da IA cresce rapidamente, a procura por HBM (memória de alta largura de banda) para servidores de IA de gama alta disparou, desviando capacidade de produção de núcleos e recursos de wafer dos fabricantes de sistemas de armazenamento. A HBM e a tecnologia 3D Flash NAND Os componentes utilizados nos SSDs são ambos semicondutores de memória e partilham algumas linhas de produção avançadas e equipamentos de fabrico essenciais. Para conquistar o mercado de memória para IA, que é altamente lucrativo, os principais fabricantes, como a Samsung, a Kioxia e a Micron, ajustaram significativamente os seus planos de produção. Estão a transferir capacidade, equipamentos e pessoal de engenharia que anteriormente se dedicavam à produção de memória flash NAND para a produção de HBM. Isto reduz diretamente a oferta de wafers NAND necessária para os SSDs de consumo. Para além da oferta já escassa devido à procura de IA, isto cria uma lacuna de capacidade ainda maior para os SSDs de consumo e é uma das principais razões para a escassez de stock e o aumento dos preços.
A escassez de discos rígidos (HDD) faz com que a procura por armazenamento para IA se desloque para os SSD
A maior parte das enormes necessidades de armazenamento de dados inativos da IA destinava-se originalmente a HDD (unidades de disco rígido). No entanto, a produção de discos rígidos (HDD) tem crescido lentamente nos últimos anos, e as compras em grande escala por parte dos centros de dados de IA provocaram uma clara escassez de oferta e atrasos nas entregas a nível mundial. Para manter as suas implementações de IA dentro do prazo, os fornecedores de serviços na nuvem e os centros de dados tiveram de ajustar as suas configurações de armazenamento. Estão agora a utilizar SSDs empresariais de alta capacidade para alguns dados «quentes» e de acesso frequente que estavam originalmente previstos para HDDs. Este efeito de substituição cria uma procura extra de SSDs, esgotando ainda mais a já escassa capacidade de memória flash NAND. Continua a reduzir o espaço de produção para SSDs de consumo e, indiretamente, faz subir os preços ao consumidor.
A escassez de DRAM faz com que os SSDs funcionem como memória adicional
O treino e a inferência de modelos de IA também requerem enormes quantidades de DRAM, e a produção global de DRAM é igualmente limitada. A DRAM de gama alta e a DRAM de nível de servidor encontram-se constantemente em escassez. Para aliviar a pressão sobre a memória e controlar os custos de hardware, os fornecedores de serviços na nuvem e as empresas de IA estão agora a utilizar amplamente SSDs NVMe de alta velocidade como extensão ou complemento da DRAM. Com a tecnologia de armazenamento em camadas, transferem dados ativos não críticos, como pesos de modelos e caches temporários, da memória para os SSDs. Isto transforma os SSDs de simples dispositivos de armazenamento numa espécie de memória secundária, gerando ainda mais compras de SSDs por parte das empresas. Isto sobrecarrega ainda mais a capacidade limitada de memória flash NAND, deixa menos espaço para os SSDs de consumo e faz subir os preços de retalho.
Os contratos de fidelização a longo prazo reservam a maior parte da capacidade para os grandes clientes de IA
Para garantir o funcionamento fiável dos seus serviços de IA, os fornecedores globais de serviços na nuvem e as principais empresas de IA estão a celebrar acordos de fornecimento a longo prazo com os três grandes fabricantes de dispositivos de armazenamento — Samsung, Micron e Kioxia. Estes acordos garantem a maior parte da capacidade de SSD e memória flash NAND para empresas durante os próximos um a dois anos, a preços e volumes fixos. Esta reserva em grande escala significa que a grande maioria da produção limitada é reservada para grandes clientes de IA. Fica muito menos capacidade disponível para o mercado aberto e para os SSD de consumo. A escassez de oferta no mercado de consumo faz com que os preços de retalho subam cada vez mais.
Os longos ciclos de expansão da produção de pastilhas NAND significam que a nova capacidade chega demasiado tarde
As linhas de produção de memória flash 3D NAND exigem um grande investimento de capital e demoram muito tempo a construir. Uma fábrica moderna de NAND de gama alta demora entre 2 a 3 anos a ficar concluída, desde a construção até aos testes dos equipamentos e à produção a pleno regime, e custa dezenas de milhares de milhões de dólares. Confrontados com a procura explosiva resultante do boom da IA, os fabricantes de armazenamento não conseguem expandir rapidamente a capacidade total de NAND a curto prazo. Podem apenas reorganizar a forma como utilizam a sua capacidade de produção existente. Uma vez que as encomendas empresariais de IA de alto valor têm prioridade, a quota de capacidade destinada aos SSD para consumidores não poderá crescer significativamente num futuro próximo. Este fosso crescente entre a oferta e a procura é a razão subjacente à manutenção dos preços elevados dos SSD para consumidores.
Em suma, não é que a capacidade de produção total seja demasiado baixa. Pelo contrário, impulsionados pelos lucros do setor da IA, os recursos de produção continuam a deslocar-se para o mercado empresarial de maior valor acrescentado. A redução da oferta para os consumidores é uma consequência natural desta reafectação de recursos a nível de todo o setor.
Em termos gerais, os aumentos de preço dos SSD impulsionados pela IA não constituem uma oscilação de mercado de curto prazo. Trata-se de uma profunda reestruturação dos padrões de procura e da alocação da produção em todo o setor do armazenamento. No passado, a eletrónica de consumo era o principal motor do mercado dos SSD. Hoje, a procura empresarial de IA assumiu o papel principal, e é improvável que esta mudança se reverta de forma significativa nos próximos anos. Para os consumidores, a era dos SSD extremamente baratos pode ter chegado ao fim, por enquanto. Os preços não voltarão aos níveis anteriores até que grandes quantidades de nova capacidade de produção entrem em funcionamento e o ritmo de crescimento da procura de IA abrande gradualmente.





