В течение долгого времени роль Твердотельные накопители была относительно ясной. Его основная задача заключалась в том, чтобы заменить механические жесткие дискиЭто повышает общую скорость отклика и пропускную способность системы. Будь то потребительские компьютеры, корпоративные серверы или центры обработки данных, технологическая эволюция твердотельных накопителей в основном вращалась вокруг нескольких неизменных целей: повышение скорости последовательного чтения/записи, увеличение емкости, снижение стоимости и повышение надежности. Однако с быстрым развитием искусственного интеллекта, особенно больших моделей и глубокого обучения, рабочие нагрузки, с которыми сталкиваются системы хранения данных, значительно изменились. В сценариях ИИ данные уже не просто "считываются, обрабатываются и записываются". Вместо этого они обладают рядом новых характеристик:
Во-первых, объем данных резко возрос. Будь то массивные исходные данные, используемые на этапе обучения модели, или параметры модели и базы векторов, к которым требуется многократный доступ на этапе вывода, - объем данных значительно превышает возможности традиционных приложений.
Во-вторых, принципиально изменилась схема доступа. Рабочие нагрузки, связанные с искусственным интеллектом, часто включают в себя большое количество небольших случайных обращений к блокам данных с высокой скоростью обмена, а не последовательное чтение и запись больших блоков, с которыми лучше справляются традиционные системы хранения данных.
В-третьих, хранение данных стало напрямую влиять на эффективность вычислений. В серверах искусственного интеллекта вычислительная мощность графических процессоров и других ускорителей растет очень быстро. Если система хранения не успевает за скоростью подачи данных, возникает "вычислительный холостой ход", что снижает общую эффективность системы.
Именно на этом фоне концепция твердотельных накопителей с искусственным интеллектом стала часто упоминаться и постепенно перешла от концепции к конкретным продуктам и техническим дорожным картам.
Что такое твердотельный накопитель с искусственным интеллектом?
Для многих новичков в этой области термин "твердотельный накопитель с искусственным интеллектом" может быть воспринят как продукт, в который встроены алгоритмы искусственного интеллекта, способные самостоятельно "обучаться" или "оптимизировать" твердотельный накопитель. Однако, согласно общепринятому отраслевому определению, такое понимание не совсем верно. Суть AI SSD заключается не в том, "есть ли внутри SSD ИИ", а в том, "создан ли SSD для рабочих нагрузок ИИ". Точнее, твердотельный накопитель AI - это тип твердотельного устройства хранения данных, глубоко оптимизированный для сценариев обучения, выводов и обслуживания данных ИИ. Такая оптимизация включает в себя как проектирование архитектуры на аппаратном уровне, так и изменения в микропрограммном обеспечении, протоколах и методах взаимодействия с системой. С точки зрения функционального позиционирования, AI SSD - это все еще устройство хранения данных; он не заменит вычислительную роль GPU или CPU. Но его цель предельно ясна: минимизировать ограничения производительности, накладываемые системой хранения данных на системы искусственного интеллекта.
Практические недостатки традиционных твердотельных накопителей в сценариях искусственного интеллекта
Чтобы понять ценность твердотельных накопителей с искусственным интеллектом, нужно сначала четко представлять себе проблемы, с которыми сталкиваются традиционные твердотельные накопители в сценариях с искусственным интеллектом.
- Задержка становится более критичной метрикой, чем пропускная способность.В традиционных приложениях, последовательное чтение/запись Пропускная способность часто является важным показателем для оценки производительности SSD, например 7 ГБ/с или 14 ГБ/с. Но в сценариях ИИ важность задержки часто превосходит пиковую пропускную способность. Это связано с тем, что задачи ИИ включают в себя большое количество мелкодисперсных запросов данных. Если каждый запрос требует ожидания в течение десятков микросекунд, то даже если объем данных в одном запросе невелик, суммарный эффект значительно замедлит общее продвижение. Типичная задержка доступа для многих корпоративных твердотельных накопителей составляет 40-100 микросекунд, что приемлемо в сценариях баз данных или виртуализации, но кажется относительно высоким для крупномасштабного анализа или обучения ИИ.
- IOPS больше не является просто "достаточно хорошим показателем". IOPS (Input/Output Operations Per Second) уже давно является одним из основных показателей для твердотельных накопителей, но в традиционных компаниях зачастую достаточно было достичь сотен тысяч IOPS. Рабочие нагрузки ИИ совершенно иные. Такие сценарии, как поиск векторов, загрузка параметров и доступ к шардингу моделей, генерируют чрезвычайно большое количество случайных запросов на чтение. В таких случаях IOPS традиционных SSD быстро становится узким местом системы. Именно поэтому в дискуссиях о технологии твердотельных накопителей с искусственным интеллектом часто упоминаются показатели в миллионы или даже десятки миллионов IOPS, что в прошлом было большой редкостью.
- Процессор становится "узким местом для передачи данных". В классической архитектуре сервера путь данных между SSD и GPU обычно выглядит следующим образом: SSD → CPU → память → GPU. Эта модель хорошо работала в эпоху вычислений общего назначения, но в серверах ИИ она создает очевидные проблемы. С одной стороны, центральный процессор должен обрабатывать большое количество перемещений данных, с другой стороны, этот путь сам по себе вносит дополнительную задержку. Поскольку вычислительная мощность GPU продолжает расти, этот путь данных, который "обходит CPU, чтобы достичь GPU", становится ограничителем общей эффективности системы.
Различия в позиционировании между твердотельными накопителями с искусственным интеллектом и традиционными твердотельными накопителями
Чтобы лучше понять разницу между ними, мы можем сравнить их с точки зрения "отправной точки дизайна".
| Сравнительное измерение | Традиционный твердотельный накопитель | ТВЕРДОТЕЛЬНЫЙ НАКОПИТЕЛЬ С ИСКУССТВЕННЫМ ИНТЕЛЛЕКТОМ |
|---|---|---|
| Основная цель | Баланс между производительностью общего назначения и стоимостью | Чрезвычайная эффективность для рабочих нагрузок ИИ |
| Фокус на оптимизацию | Последовательное чтение/запись, емкость, надежность | Низкая задержка, высокая скорость ввода-вывода, высокий параллелизм |
| Типовые применения | ПК, сервер, база данных | Обучение ИИ, вывод, векторный поиск |
| Шаблон доступа к данным | Смешанные, преимущественно последовательные | Мелкоблочные, случайные, высококонкурентные |
| Сотрудничество в системе | Ориентированный на процессор | Ближе к GPU/акселератору |
Важно подчеркнуть, что твердотельные накопители AI не предназначены для замены традиционных SSD. В подавляющем большинстве сценариев общего назначения традиционные SSD остаются более разумным и экономически эффективным выбором. Существование AI SSD направлено на обслуживание систем, которые уже "доведены до предела" рабочими нагрузками ИИ.
Основное положение твердотельных накопителей с искусственным интеллектом
С точки зрения системы, основную роль твердотельного накопителя AI можно свести к одному предложению: его задача - не просто хранить данные, а эффективно, стабильно и непрерывно предоставлять их вычислительному блоку AI. Для достижения этой цели твердотельные накопители AI обычно фокусируются на оптимизации в следующих направлениях:
- Чрезвычайно низкая задержка доступа
- Очень высокая производительность случайных операций ввода-вывода
- Внутренняя архитектура, более приспособленная к шаблонам доступа к данным ИИ
- Более жесткие методы взаимодействия на уровне системы
Эти характеристики достигаются не просто за счет параметров укладки, а зачастую требуют переосмысления конструкции контроллера SSD, стратегий управления флэш-памятью и даже методов системного интерфейса.
Ключевые технические характеристики и архитектурные подходы к твердотельным накопителям с искусственным интеллектом
Твердотельные накопители с искусственным интеллектом - это не просто использование существующего корпоративного твердотельного накопителя, повышение производительности контроллера, добавление большего объема флеш-памяти и максимальное увеличение скорости интерфейса для естественного соответствия сценариям искусственного интеллекта. Настоящая сложность заключается в структурном различии между схемами доступа рабочих нагрузок ИИ и традиционных приложений хранения данных. Технологическая эволюция твердотельных накопителей для ИИ - это, по сути, редизайн, ориентированный на модели доступа к данным.
Чрезвычайно низкая задержка
В системах искусственного интеллекта задержка хранения данных часто напрямую определяет коэффициент использования вычислительных ресурсов. Если взять в качестве примера GPU, то его вычислительная мощность растет гораздо быстрее, чем системы хранения данных. Если GPU простаивает в ожидании данных, то даже если теоретическая вычислительная мощность GPU высока, фактическая пропускная способность значительно снизится. В этом случае средней задержки недостаточно; хвостовая задержка еще более критична. Одна операция ввода-вывода с ненормальной задержкой может замедлить выполнение всего пакета.
Задержка доступа традиционных корпоративных NVMe SSD обычно находится на уровне десятков микросекунд, что является очень зрелым и стабильным результатом. Но в сценариях ИИ индустрия стремится еще больше сократить время ожидания до уровня десяти микросекунд или даже близкого к однозначным микросекундам. Достичь этого можно не только за счет увеличения скорости интерфейса; для этого требуется систематическая оптимизация в следующих областях:
- Сокращение количества прерываний и контекстных переключений в пути управления
- Оптимизация стратегий планирования доступа к флэш-памяти
- Сокращение внутреннего пути обработки данных внутри контроллера
Можно сказать, что оптимизация латентности - это систематический проект, который проходит через весь процесс проектирования твердотельных накопителей AI.
Сверхвысокие показатели IOPS
Во время обучения и вывода модели доступ к данным часто имеет "фрагментарные" характеристики. Например:
- Параметры модели разбиты на множество небольших блоков.
- Векторные базы данных требуют частого доступа к индексам и функциям.
- Несколько моделей или задач выполняются параллельно.
В таких сценариях SSD сталкивается не с несколькими крупными непрерывными запросами, а с огромным количеством одновременных мелких запросов. Таким образом, IOPS становится ключевым показателем, определяющим потолок производительности. В традиционных корпоративных твердотельных накопителях несколько сотен тысяч IOPS уже считаются высоким уровнем. При проектировании твердотельных накопителей с искусственным интеллектом обычно ставятся цели в миллионы, несколько миллионов или даже десятки миллионов IOPS. Важно отметить, что IOPS, о котором здесь идет речь, - это не просто пиковое значение в лабораторных условиях, а устойчивые возможности в условиях высокого параллелизма и низкой задержки. Повышение IOPS - это не та проблема, которую можно решить простым "открытием большего количества очередей". Когда количество одновременных запросов чрезвычайно велико, быстро возникают следующие проблемы:
- Повышенная сложность управления очередями
- Неравномерная нагрузка на каналы флэш-памяти
- Помехи от усиления записи и сборки мусора
Поэтому твердотельные накопители с искусственным интеллектом часто нуждаются в более агрессивных стратегиях планирования одновременной работы на уровне встроенного ПО, а также в более тонком управлении ресурсами флеш-памяти.
Совместное проектирование систем для графических процессоров и ускорителей
В классической серверной архитектуре обычно нет прямого пути передачи данных между SSD и GPU. Перед отправкой на GPU данные должны пройти через центральный процессор и системную память. Проблемы такой архитектуры усиливаются в серверах с искусственным интеллектом. По мере увеличения количества графических процессоров и повышения вычислительной мощности одной карты проблемы эффективности непрямого пути становятся все более очевидными. Для решения этой проблемы твердотельные накопители для ИИ начинают предпринимать новые попытки на системном уровне, такие как:
- Поддержка режимов прямого или почти прямого доступа к данным на GPU.
- Сокращение ненужного участия процессора.
- Оптимизация пути передачи данных между хранилищем и ускорителями.
Такие конструкции не обязательно подразумевают полный отказ от центрального процессора, а скорее сокращение времени копирования и передачи данных в соответствующих сценариях для повышения общей эффективности. В такой архитектуре хранилище больше не является просто "пассивным хранилищем данных", а больше похоже на активный узел обслуживания данных в системе искусственного интеллекта. Оно должно понимать шаблоны доступа верхнего уровня, быстро реагировать на одновременные запросы и эффективно взаимодействовать с вычислительными блоками. Именно поэтому разработка твердотельных накопителей для ИИ часто требует глубокого сотрудничества со всей машинной системой и даже с производителями GPU.
Большая вместимость и высокая плотность
Поскольку объем параметров больших моделей продолжает расти, а размер отдельных моделей часто достигает сотен ГБ или даже нескольких ТБ, системы хранения данных должны обладать достаточной емкостью и плотностью, чтобы поддерживать реальное развертывание. Кроме того, системы ИИ часто нуждаются в хранении нескольких версий моделей, данных обучения, промежуточных результатов, векторных баз данных, индексов и т. д. Поэтому высокая емкость и высокая плотность - еще одна важная характеристика твердотельных накопителей для ИИ. Однако высокая емкость не бывает "бесплатной". Увеличение плотности флэш-памяти часто связано с определенными затратами:
- Увеличение задержки доступа в расчете на один флеш-накопитель.
- Ограниченная одновременная производительность.
- Проблемы с выносливостью и надежностью.
Поэтому, стремясь к увеличению емкости, твердотельные накопители с искусственным интеллектом также должны минимизировать потери производительности, вызванные высокой плотностью, с помощью архитектурных решений и планирования.
Состояние отрасли и будущие тенденции развития твердотельных накопителей с искусственным интеллектом
Если смотреть с точки зрения жизненного цикла технологии, то твердотельные накопители с искусственным интеллектом все еще находятся на стадии "раннего принятия и быстрого освоения". С одной стороны, твердотельные накопители с искусственным интеллектом - это не просто маркетинговый термин, который остается на уровне концепций; рабочие нагрузки с искусственным интеллектом уже существуют и быстро растут в центрах обработки данных, облачных вычислительных платформах и на крупных предприятиях. С другой стороны, твердотельные накопители с искусственным интеллектом еще не сформировали полностью унифицированную и стандартизированную форму продукта. Настоящие твердотельные накопители, полностью ориентированные на искусственный интеллект, все еще в основном ограничены специализированными, предварительными исследованиями и высокотехнологичными корпоративными продуктами и находятся на некотором расстоянии от широкого распространения.
С развитием твердотельных накопителей с искусственным интеллектом меняются роли в традиционной цепочке индустрии хранения данных. В прошлом производители SSD больше внимания уделяли производительности и надежности отдельных устройств. В сценарии ИИ им необходимо раньше принимать участие в проектировании на уровне системы, сотрудничать с поставщиками серверов, GPU и облачных платформ, а также проводить глубокую оптимизацию под конкретные рабочие нагрузки ИИ. В результате стираются границы между производителями оригинального оборудования для хранения данных, производителями контроллеров и системными интеграторами.
Будущие твердотельные накопители с искусственным интеллектом, вероятно, перестанут быть просто "устройством, подключаемым к слоту PCIe", а будут более глубоко продуманы совместно с вычислительными ресурсами на системном уровне. Это может выражаться в более прямых путях передачи данных, меньшем количестве промежуточных копий и более тесном взаимодействии программного и аппаратного обеспечения. Это приведет к дальнейшему ослаблению границы между хранением и вычислениями. С другой стороны, по мере масштабирования систем ИИ "передача всех вычислений GPU" не всегда является оптимальным решением. В некоторых сценариях, если устройство хранения данных возьмет на себя часть задач по обработке данных или предварительной обработке, это поможет снизить общую нагрузку на систему. Хотя подобные идеи все еще находятся на стадии исследования, они стали предметом пристального внимания индустрии.
Твердотельные накопители с искусственным интеллектом - это не новый вид, который кардинально меняет представление о хранении данных, а перестройка роли хранения данных, ориентированная на рабочие нагрузки с искусственным интеллектом. Его появление обусловлено фундаментальными изменениями, которые ИИ вносит в модели доступа к данным; его ценность заключается не в преувеличенном улучшении отдельных показателей, а в постоянном повышении эффективности системы; в будущем он не заменит все SSD, а станет незаменимой частью инфраструктуры ИИ. Если GPU - это "двигатель" системы ИИ, то твердотельные накопители для ИИ больше похожи на топливную систему, обеспечивающую стабильную и непрерывную подачу топлива. Он может быть не самым заметным, но если он отстает, это сказывается на всей системе.





