HBF: Uma nova estrela flash de grande largura de banda que quebra a "barreira da memória" para a IA

Estamos a viver numa era impulsionada pela inteligência artificial. Grandes modelos como o ChatGPT ou o Sora estão a remodelar várias indústrias. No entanto, estes modelos têm enormes "apetites"; os seus parâmetros maciços colocam sérios desafios aos sistemas de computação e armazenamento. Quando as velocidades de computação dos chips são rápidas, mas o fornecimento de dados não consegue acompanhar, forma-se o chamado estrangulamento da "parede de memória". A tecnologia Flash de elevada largura de banda é uma inovação fundamental que nasceu precisamente para quebrar esta barreira e injetar um poderoso impulso nos sistemas de IA a um custo mais económico.

article high bandwidth flash review header img 1350x700 1 HBF: Uma nova estrela do flash de alta largura de banda que quebra a "barreira da memória" para a IA

O que é a HBF? Como é que ela consegue o "melhor dos dois mundos"?

O Flash de elevada largura de banda não é um suporte de armazenamento totalmente novo, mas sim uma inovação arquitetónica inteligente. A sua ideia central é combinar a tecnologia 3D Memória flash NAND A HBF é uma tecnologia de memória flash de alta capacidade, comumente encontrada em nossas vidas diárias (usada em telefones e unidades de estado sólido) com a avançada tecnologia de empacotamento e interconexão da HBM, que é comumente usada em computação de alto desempenho. Em poucas palavras, o objetivo da HBF é proporcionar à memória flash de alta capacidade e baixo custo velocidades de transferência de dados próximas às da memória de ponta, alcançando assim um equilíbrio ideal entre capacidade, largura de banda e custo. Atingir este objetivo depende principalmente de dois grandes avanços tecnológicos.

A primeira é a tecnologia de empilhamento 3D e de interconexão TSV. O sucesso do HBM reside no empilhamento vertical de múltiplos chips DRAM como blocos de construção usando Vias Through-Silicon, permitindo a comunicação de alta velocidade através de minúsculos canais verticais. A HBF toma emprestado este conceito, realizando o empilhamento de alta densidade de múltiplos chips flash NAND. Este design encurta significativamente os caminhos internos de transmissão de dados dentro do chip, aumenta a densidade de integração e estabelece as bases para uma elevada largura de banda.

O segundo avanço, e mais crítico, é a arquitetura de subpavimentos paralelos. Embora a memória flash NAND tradicional tenha uma grande capacidade, o número de canais que podem ler e escrever dados em simultâneo é limitado. Isto é como uma estrada larga com muito poucas entradas e saídas, propensa a congestionamentos. A HBF inova a estrutura central da memória flash, dividindo-a num grande número de sub-arrays de armazenamento que podem funcionar de forma independente e em paralelo. Cada sub-matriz tem os seus próprios canais independentes de leitura/escrita. Quando centenas ou milhares dessas sub-matrizes funcionam em simultâneo, é equivalente a expandir uma estrada de faixa única para uma rede de alta velocidade com milhares de faixas, permitindo que o dilúvio de dados flua sem obstáculos, conseguindo assim um salto na largura de banda total.

oscoo 2b banner 1400x475 1 HBF: Uma nova estrela flash de alta largura de banda que quebra a "barreira da memória" para a IA

Para demonstrar mais claramente o posicionamento exclusivo da HBF, a tabela abaixo compara suas principais caraterísticas com seus "predecessores" HBM e SSDs NAND tradicionais:

Caraterística HBF HBM SSD NAND tradicional
Vantagem principal Elevada capacidade, elevada largura de banda, baixo custo Largura de banda extremamente elevada, latência ultra-baixa Alta capacidade, custo muito baixo
Capacidade típica por pilha/chip Até 512GB Aprox. 24-48GB 1TB-2TB
Nível de largura de banda Muito elevado, próximo da HBM Extremo Relativamente baixo
Custo por unidade Relativamente baixo Muito elevado Muito baixo
Melhor aplicação Inferência de IA, tarefas de leitura intensiva Formação em IA, computação de alto desempenho Armazenamento de dados, arquivo

Esta comparação mostra intuitivamente que a HBF preenche precisamente a lacuna de mercado entre a HBM e a SSDs tradicionais. Ele não possui a latência ultrabaixa e a velocidade de gravação extrema do HBM, mas oferece uma capacidade muito maior e um custo muito menor. Em comparação com os SSDs tradicionais, ele atinge uma largura de banda ordens de magnitude maior, nascida para cenários que exigem leitura rápida de dados massivos.

Caraterísticas técnicas, vantagens e desafios

O valor do Flash de elevada largura de banda reside na sua combinação única de caraterísticas técnicas, que definem as suas capacidades actuais e as principais direcções de aplicação. Não é todo-poderoso, mas destaca-se nas suas áreas de especialização. O seu estado atual pode ser claramente apresentado através da comparação das suas vantagens e desafios.

Três vantagens principais da HBF

  1. Enorme capacidade e vantagem em termos de custos: No mesmo espaço físico, uma única pilha HBF pode fornecer até 512 GB de capacidade, mais de 10 vezes mais do que o HBM. Com base no flash NAND de menor custo por unidade, pode reduzir significativamente o custo total de propriedade para sistemas de IA.
  2. Elevada largura de banda de leitura e eficiência energética: Através da sua arquitetura paralela, a sua largura de banda de leitura pode aproximar-se dos níveis da HBM, satisfazendo as necessidades de tarefas como a inferência de IA para uma leitura rápida de dados. Entretanto, o seu consumo de energia estático é muito inferior ao da DRAM, que requer uma atualização constante.
  3. Posicionamento preciso no mercado: Ele preenche com precisão a lacuna entre o HBM e os SSDs tradicionais, fornecendo uma solução ideal para aplicativos de leitura intensiva sensíveis à capacidade e ao custo.

Principais desafios enfrentados pela HBF

  1. Limitações de velocidade e resistência de escrita: Estas são caraterísticas inerentes ao flash NAND. A velocidade de gravação do HBF é muito mais lenta do que a do HBM, e seus chips têm ciclos limitados de apagamento/gravação. Portanto, não é adequado para cenários de treinamento de modelos de IA que exigem gravação frequente de dados.
  2. Maior latência de acesso: Sua latência de acesso está no nível de microssegundos. Embora isso tenha pouco impacto em muitas tarefas de leitura, ainda é muito maior do que a latência de nível de nanossegundo do HBM e não pode lidar com aplicações extremamente sensíveis à latência.

Em resumo, uma compreensão precisa do status atual do HBF é: ele é uma solução de armazenamento de alto desempenho otimizada para tarefas de leitura intensiva. Ele não é um substituto para o HBM, mas um poderoso complemento. O seu valor está em aproveitar os seus pontos fortes e evitar as suas fraquezas para resolver problemas específicos.

Perspectivas futuras para a HBF

Com base nas suas caraterísticas de "grande capacidade, elevada largura de banda de leitura, baixo custo e resistência de escrita limitada," O futuro caminho de desenvolvimento da HBF é muito claro. Ela não substituirá a posição da HBM em treinamento, mas criará seu próprio nicho de mercado e formará um ecossistema complementar com as tecnologias existentes.

Cenários de aplicações principais

As aplicações de morte para a HBF concentram-se principalmente nas seguintes direcções:

Servidores de Inferência de Borda de IA. Este é o cenário de aplicação mais ideal e promissor para a HBF. A implementação de modelos de IA em servidores de ponta para inferência envolve cargas de trabalho que são quase exclusivamente operações de leitura, chamando frequentemente parâmetros de modelo pré-treinados. Isso combina perfeitamente com as vantagens do HBF de alta largura de banda de leitura e enorme capacidade, evitando seus pontos fracos de gravações lentas e resistência limitada. Além disso, o baixo consumo de energia do HBF é adequado para ambientes de ponta sensíveis à energia.

Formando uma arquitetura de memória heterogénea ou híbrida com HBM. Em centros de dados em nuvem, o HBF pode servir como uma extensão de capacidade efetiva para o HBM. Neste modelo, o HBM atua como um cache de alta velocidade, mantendo os "dados quentes" mais urgentemente necessários para a computação atual, enquanto o modelo completo e massivo de IA é armazenado no HBF. Diferentes partes dos parâmetros do modelo são então pré-configuradas em alta velocidade do HBF para o HBM, conforme necessário. Essa combinação oferece um equilíbrio atraente entre desempenho, capacidade e custo total.

Olhando para o futuro, espera-se que a tecnologia HBF chegue a dispositivos do utilizador final. Como os PCs com IA e os smartphones topo de gama exigem capacidades locais de IA mais fortes, a integração da HBF poderia permitir a estes dispositivos executar localmente modelos de parâmetros maiores, reduzindo a dependência da nuvem e protegendo melhor a privacidade do utilizador.

Desenvolvimento tecnológico e processo de industrialização

Em termos de desenvolvimento tecnológico, as empresas líderes já planearam roteiros claros. Por exemplo, SandDisk planeia uma iteração contínua através de três gerações de produtos, com objectivos que incluem o aumento da capacidade de um único chip para além de 512 GB e a duplicação da largura de banda de leitura em relação aos níveis actuais, ao mesmo tempo que optimiza continuamente a eficiência energética.

O processo de industrialização também já começou. A colaboração entre SK Hynix e a SandDisk marca um passo fundamental para a passagem da HBF da I&D para a industrialização. A indústria geralmente prevê que as amostras do módulo HBF estarão disponíveis no segundo semestre de 2026, e os primeiros servidores de inferência de IA que integram o HBF deverão ser oficialmente lançados no início de 2027. Os analistas de mercado prevêem que, até 2030, a HBF tem potencial para se tornar um mercado no valor de dezenas de milhares de milhões de dólares americanos. Embora sua escala possa ser menor que a do HBM, ele se tornará uma parte indispensável da infraestrutura de IA.

Em conclusão, o futuro da HBF reside no facto de ser uma peça-chave no ecossistema de armazenamento de IA. O seu desenvolvimento irá girar em torno de tarefas de leitura intensiva, capacitando gradualmente a próxima geração de aplicações de IA desde a nuvem até à periferia.

Deslocar para o topo

Contacte-nos

Preencha o formulário abaixo e entraremos em contacto em breve.

Formulário de contacto Produto