HBM4: Революция памяти в эпоху вычислений с искусственным интеллектом

В современную стремительно развивающуюся эпоху искусственного интеллекта и высокопроизводительных вычислений пропускная способность памяти стала критически узким местом, ограничивающим вычислительную мощность, что в индустрии часто называют проблемой “стены памяти”. Представьте, что вычислительные возможности GPU - это конвейер суперфабрики, а традиционная память обеспечивает лишь узкую “трубу подачи сырья”, в результате чего дорогостоящие вычислительные ресурсы простаивают в ожидании данных. Это основная проблема, с которой сегодня сталкивается обучение ИИ. Память HBM4 (High Bandwidth Memory 4) призвана раз и навсегда устранить это узкое место, обеспечив необходимую основу для хранения данных в условиях бурного роста вычислений на базе ИИ.

HBM4 The Memory Revolution in the Age of AI Computing header img HBM4: Революция памяти в эпоху вычислений с искусственным интеллектом

Что такое HBM4?

Память с высокой пропускной способностью была создана для решения проблемы “стены памяти” путем увеличения пропускной способности памяти для высвобождения вычислительной мощности. В нем используется философия проектирования, совершенно отличная от традиционной памяти - вертикальное укладывание нескольких чипов DRAM и их высокоскоростное соединение с помощью технологии сквозных кремниевых проходов (TSV), что позволяет достичь огромной ширины передачи данных при крайне малой физической площади. С момента появления первого поколения HBM в 2013 году до сегодняшнего дня это семейство развивалось более десяти лет, и HBM4 является его последней вехой.

oscoo 2b баннер 1400x475 1 HBM4: Революция памяти в эпоху вычислений с искусственным интеллектом

HBM4 - это технология памяти с высокой пропускной способностью шестого поколения, официально выпущенная как Стандарт JESD270-4 JEDEC в апреле 2025 года. Являясь преемником HBM3/HBM3E, она предназначена для обучения искусственному интеллекту, высокопроизводительных вычислений и высококлассных GPU для центров обработки данных. Она продолжает 3D-стековую архитектуру семейства HBM, вертикально укладывая несколько чипов DRAM и объединяя их с логической базовой матрицей для достижения чрезвычайно высокой плотности пропускной способности и компактной упаковки, что позволило ей получить отраслевое прозвище “суперзернохранилище” для вычислений ИИ.

Что делает HBM4 таким мощным?

HMB4 Более широкий интерфейс и более высокая пропускная способность HBM4: Революция памяти в эпоху вычислений с искусственным интеллектом

По сравнению с предыдущим поколением HBM3E, HBM4 обеспечивает значительный скачок производительности. В таблице ниже вы найдете краткое описание основных изменений:

Технические характеристикиHBM3HBM4Улучшение
Ширина интерфейса1024 бит2048 битУдвоенный
Стандартная пропускная способность~819 ГБ/с2 ТБ/с~2.4×
Независимые каналы1632Удвоенный
Максимальная вместимость одного штабеля24 ГБ (8-Hi)64 ГБ (16-Hi)~2.7×
Рабочее напряжениеФиксированное ~1,1 ВVDDQ 0.7-0.9V, VDDC 1.0-1.05VБолее гибкие, более эффективные

Теперь давайте разберемся, что на самом деле означают эти цифры.

Более широкий интерфейс, более высокая пропускная способность

HBM4 удваивает интерфейс данных на стек с 1024 бит до 2048 бит. Что это значит? Самая современная память DDR5 сегодня имеет ширину одноканального интерфейса всего 64 бита. Это означает, что один стек HBM4 имеет эквивалентную пропускную способность 32 каналов DDR5, работающих одновременно. При удвоении ширины интерфейса общая пропускная способность автоматически удваивается даже при той же скорости передачи данных. А реальные продукты производителей часто работают на более высоких скоростях, поэтому конечная пропускная способность может легко превышать 2 ТБ/с и даже достигать более 3 ТБ/с.

Больше каналов, более гибкое планирование данных

Количество каналов увеличивается с 16 до 32, и каждый канал включает в себя два псевдоканала. Каналы можно представить как независимые “дорожки” внутри памяти - больше каналов означает, что система может одновременно выдавать больше запросов на доступ к памяти, не мешая друг другу. Это особенно полезно для массовых параллельных матричных операций в вычислениях ИИ, значительно снижая количество запросов на доступ и повышая эффективную пропускную способность.

Большая емкость, вмещающая всю модель

Если увеличить количество слоев стека DRAM с 8 до 16, объем одного стека памяти HBM4 может достигать 64 ГБ. В реальных продуктах ускорители искусственного интеллекта обычно объединяют от 4 до 8 стеков HBM, то есть общий объем памяти может легко превысить 256 или даже 512 ГБ. Для больших моделей с триллионами параметров такая емкость позволяет размещать параметры модели и промежуточные результаты полностью в высокоскоростной памяти, исключая частые пересылки из более медленной VRAM или системной памяти.

Более низкое напряжение, более высокая энергоэффективность

В HBM4 реализовано более тонкое управление напряжением. Напряжение ввода/вывода VDDQ можно регулировать в диапазоне от 0,7 до 0,9 В, а напряжение ядра VDDC можно выбирать в диапазоне от 1,0 до 1,05 В. Более низкие напряжения напрямую снижают энергопотребление. По данным производителя, энергия HBM4 в расчете на один переданный бит примерно на 40% меньше, чем у HBM3E. Для крупных центров обработки данных это означает снижение счетов за электроэнергию и уменьшение потребности в охлаждении.

Новая функция безопасности: DRFM

В HBM4 также добавлена важная функция надежности - управление направленным обновлением (DRFM). Она эффективно защищает от атак типа “Row-Hammer” - уязвимости, при которой многократное и быстрое чтение и запись соседних строк памяти приводит к перевороту битов в соседних строках. DRFM интеллектуально определяет и выборочно обновляет эти строки, значительно повышая безопасность памяти и целостность данных.

Каковы ключевые технические достижения в HBM4?

Гибридное скрепление

Гибридное склеивание рассматривается как следующее революционное решение в области упаковки памяти. Традиционная технология micro-bump использует металлические бугорки микронного размера для соединения чипов с шагом около 10 мкм - физическое ограничение, которое не позволяет укладывать чипы с большей плотностью и ускорять передачу сигнала. Гибридное соединение полностью устраняет эти неровности, подготавливая медные поверхности двух чипов, чтобы они были атомарно ровными и чистыми, а затем приводя их в прямой контакт, чтобы атомы меди диффундировали и сплавлялись под воздействием температуры и давления.

Согласно данным испытаний, опубликованным Samsung, гибридное склеивание позволяет уменьшить шаг межчиповых соединений до менее 10 мкм, увеличивая плотность межсоединений от нескольких раз до десятков раз, обеспечивая при этом меньшее сопротивление, более короткие пути прохождения сигналов и лучший отвод тепла. Данные измерений Samsung показывают, что безгибридное гибридное склеивание позволяет увеличить высоту стека HBM на треть и снизить тепловое сопротивление на 20%. Однако, поскольку оборудование для гибридного склеивания стоит дорого (примерно в два раза дороже, чем традиционные бондеры), а производительность массового производства все еще нуждается в улучшении, эта технология пока не применяется в текущих объемах производства продуктов HBM4. Samsung отправила заказчикам образцы 16-Hi HBM с гибридным склеиванием, и ожидается, что коммерческое внедрение начнется постепенно с HBM4E (улучшенной версии HBM4).

Распределенный интерфейс и псевдоканальная архитектура

В HBM4 используется конструкция с 32 полностью независимыми каналами - в два раза больше, чем в HBM3, и каждый канал оснащен 2 псевдоканалами, поддерживающими 32 режима DQ. Преимущество такой распределенной архитектуры заключается в том, что она не требует синхронной работы всех каналов. Каждый канал может обрабатывать запросы данных независимо, что значительно повышает эффективность параллельного доступа. Это особенно хорошо подходит для тензорных операций и нерегулярных шаблонов доступа к данным при обучении моделей ИИ.

По сравнению с одноканальным дизайном традиционной памяти многоканальная архитектура HBM4 подобна расширению однополосного шоссе на 32 независимых многополосных магистрали, каждая из которых способна эффективно передавать данные одновременно, что полностью устраняет пробки и позволяет GPU более полно использовать свои вычислительные возможности.

Широкоинтерфейсный дизайн с низким энергопотреблением

HBM4 использует стратегию “сверхширокий интерфейс + относительно низкая тактовая частота” для достижения чрезвычайно высокой пропускной способности при сохранении низкой плотности энергопотребления. Традиционная память часто увеличивает пропускную способность за счет повышения тактовых частот, что приводит к резкому увеличению энергопотребления. В HBM4 все наоборот: благодаря шине данных шириной 2048 бит она обеспечивает в несколько раз большую пропускную способность, чем обычная память, при относительно скромных частотах. Такая конструкция позволяет снизить энергопотребление HBM4 на бит на 30-40%, что является значительным преимуществом в тенденции снижения стоимости и повышения эффективности ИИ.

Кроме того, HBM4 поддерживает оптимизацию напряжения VDDQ в зависимости от производителя (настраивается в диапазоне от 0,7 до 0,9 В), что еще больше повышает энергоэффективность. Это позволяет крупным центрам обработки данных эффективно контролировать общую мощность и снижать эксплуатационные расходы. В то же время HBM4 сохраняет обратную совместимость с контроллерами HBM3 - один контроллер может поддерживать оба поколения памяти, что снижает барьер для модернизации системы.

HBM4 Прогресс и дорожные карты трех гигантов

Samsung - первый производитель в мире, объявивший о массовом производстве HBM4. 12 февраля 2026 года компания Samsung Electronics объявила о начале первого в мире коммерческого массового производства HBM4 и о начале поставок заказчикам, используя 4-нм логическую матрицу и технологию укладки 12-Hi, обеспечивая скорость передачи данных 11,7 Гбит/с и пропускную способность 3,3 ТБ/с, что значительно превышает стандарт JEDEC 8 Гбит/с и 2 ТБ/с. Samsung планирует представить образцы HBM4E во второй половине 2026 года для дальнейшего повышения производительности, а также разработать версию с укладкой 16-Hi, которая увеличит емкость одного стека до 48 ГБ, прокладывая путь для ускорителей ИИ следующего поколения.

SK Hynix стремительно продвигается в области HBM4. Согласно ее технологической дорожной карте, в 2026 году она планирует выпустить 16-Hi стекированный продукт HBM4 емкостью 48 ГБ с унифицированной шириной интерфейса до 2048 бит. Хотя компания активно инвестирует в технологии упаковки нового поколения, такие как гибридное склеивание, в продемонстрированных ею образцах 16-Hi до сих пор используется зрелая технология MR-MUF. SK Hynix планирует начать серийное производство в 2026 году, тесно сотрудничая с такими крупными заказчиками, как NVIDIA и AMD.

Компания Micron Technology подтвердила, что ее память HBM4 поступила в массовое производство в первом квартале 2026 года. Первые поставки - это 36 ГБ 12-Hi версии, обеспечивающие пропускную способность памяти более 2,8 ТБ/с. Продукт будет специально создан для платформы Vera Rubin от NVIDIA для поддержки обучения ИИ в центрах обработки данных нового поколения. Такая стратегия “индивидуальной настройки по требованию” выгодно позиционирует Micron в определенных сегментах потребителей.

Как HBM4 расширит возможности ИИ и высокопроизводительных вычислений?

HBM4 расширяет возможности ИИ и высокопроизводительных вычислений HBM4: Революция памяти в эпоху вычислений с искусственным интеллектом

Ускорители искусственного интеллекта нового поколения

HBM4 стала стандартной памятью для графических процессоров нового поколения для центров обработки данных. Основные производители чипов для ИИ - NVIDIA, AMD, Intel - используют HBM4 в своих новейших платформах ускорителей. Например, в платформе Vera Rubin от NVIDIA с восемью стеками HBM4 теоретическая пропускная способность памяти может достигать 22 ТБ/с, а начальный объем памяти 288 ГБ обеспечивает достаточное пространство и каналы данных для обучения больших моделей с триллионами параметров. Следующее поколение серии Instinct MI400 от AMD также планирует использовать мощные конфигурации HBM4: модель MI455X будет оснащена 12 стеками HBM4 общей емкостью 432 ГБ и пропускной способностью 19,6 ТБ/с, ориентированными на задачи крупномасштабного обучения и выводов ИИ, требующие большого объема памяти и пропускной способности. Кроме того, следующий ИИ-ускоритель Intel Jaguar Shores также будет использовать технологию HBM4. Хотя конкретные показатели пропускной способности и емкости не раскрываются, присоединение к экосистеме HBM4 является очевидным направлением.

Возможность обучения больших моделей без ограничений по памяти

Генеративное обучение ИИ, особенно для больших языковых моделей с сотнями миллиардов или даже триллионами параметров, является основным сценарием применения HBM4. Такие модели требуют одновременной обработки огромных наборов параметров и данных, что предъявляет чрезвычайно высокие требования к пропускной способности и объему памяти. Объем памяти 288-384 ГБ на карту ускорителя, предоставляемый HBM4, означает, что одна карта может хранить большие параметры модели и длинные контекстные окна, которые ранее требовали совместной работы нескольких карт. Это устраняет необходимость частого разделения данных между картами во время обучения, позволяет избежать накладных расходов на связь и потерь эффективности от разделения моделей, что значительно сокращает циклы обучения. При реальном развертывании сервисов ИИ HBM4 позволяет повысить производительность вычислений на больших моделях более чем на 69%.

Ускорение научных исследований и моделирования

В области высокопроизводительных вычислений HBM4 обеспечивает критически важную инфраструктуру для научных вычислений, требующих огромной пропускной способности данных. Будь то прогнозирование погоды, моделирование квантовых вычислений или анализ последовательностей генома - все они зависят от систем памяти с высокой пропускной способностью и высокой емкостью. Возьмем прогнозирование погоды: глобальные метеостанции, спутники и радары ежеминутно генерируют огромные объемы данных в режиме реального времени. HBM4 может быстро обрабатывать эти потоки данных, позволяя суперкомпьютерам выполнять более детальные расчеты атмосферных моделей за меньшее время, тем самым повышая точность и скорость раннего оповещения при прогнозировании экстремальных погодных условий. При секвенировании генома HBM4 может одновременно сравнивать и анализировать миллионы генетических последовательностей, ускоряя выявление генов, связанных с заболеваниями, и мишеней для лекарств, экономя драгоценное время для разработки новых препаратов.

Расширение возможностей высококлассной графики и профессиональной визуализации

Хотя сегодня в потребительских видеокартах в основном используется память GDDR, серия HBM всегда была потенциальным выбором для профессиональных графических рабочих станций и игровых карт высшего уровня благодаря своей сверхвысокой пропускной способности и низкому энергопотреблению. По мере того как стоимость массового производства HBM4 постепенно снижается, обычные пользователи могут в скором времени наслаждаться более плавным и эффективным созданием контента в таких сценариях, как игры 8K, рендеринг в реальном времени и редактирование видео. Профессионалам, работающим с видео сверхвысокого разрешения и сложным 3D-моделированием, HBM4 позволит значительно сократить время ожидания рендеринга, сделав творческий процесс более плавным и естественным.

HBM4, технология памяти с высокой пропускной способностью шестого поколения, обеспечивает двойной скачок в пропускной способности и емкости благодаря 2048-битному сверхширокому интерфейсу, 32-канальной архитектуре и технологии гибридного связывания. Это ключевое решение для преодоления узкого места “стены памяти”. Она не только обеспечивает мощную поддержку хранения данных для обучения искусственному интеллекту, высокопроизводительных вычислений и высококлассных графических процессоров в центрах обработки данных, но и знаменует начало новой эры, когда технология памяти вступает в эпоху гибридного связывания и 3D-стекирования. После широкомасштабной коммерциализации HBM4 и дальнейшего совершенствования ее технологии у нас есть все основания полагать, что вычислительные мощности ИИ получат новый всплеск роста, откроют новые передовые технологии и сценарии применения, а также внесут огромные изменения в развитие человеческого общества".

滚动至顶部

Свяжитесь с нами

Заполните форму ниже, и мы свяжемся с вами в ближайшее время.

Продукт контактной формы