لا تستخدم مراكز بيانات الذكاء الاصطناعي محركات أقراص SSD أو محركات الأقراص الصلبة حصريًا. فهي عادةً ما تنشر كلا النوعين من محركات الأقراص بطريقة هجينة. تتعامل محركات أقراص الحالة الصلبة، بأدائها الممتاز، مع أعباء العمل الأساسية في عمليات الذكاء الاصطناعي التي تتطلب سرعة عالية، وتعمل كوسيلة أساسية لإطلاق قوة الحوسبة. تتولى محركات الأقراص الصلبة، بالاعتماد على سعتها الكبيرة وتكلفتها المنخفضة، تخزين وأرشفة كميات هائلة من البيانات. يعمل الاثنان معاً لتشكيل نظام تخزين متكامل.
سبب الحاجة إلى النشر المختلط
تعتمد مراكز بيانات الذكاء الاصطناعي النشر الهجين لـ محركات أقراص SSD ومحركات الأقراص الصلبة في المقام الأول لأن الاثنين يتمتعان بنقاط قوة تكميلية واضحة من حيث الأداء والتكلفة. لا تحتوي محركات الأقراص ذات الحالة الثابتة على أجزاء متحركة، وتقوم بقراءة وكتابة البيانات بالكامل من خلال إشارات إلكترونية، مما يجعلها سريعة للغاية. وعادةً ما يُقاس زمن انتقالها بالميكروثانية، وأداء القراءة/الكتابة العشوائية (IOPS) أعلى بمئات أو حتى آلاف المرات من أقراص التخزين الصلبة. تُمكِّن هذه الخصائص محركات الأقراص ذات الحالة الثابتة من تلبية متطلبات سرعة الوصول إلى البيانات العالية لتدريب الذكاء الاصطناعي والاستدلال. وعلى النقيض من ذلك، تعتمد محركات الأقراص الصلبة على رؤوس مغناطيسية لقراءة البيانات وكتابتها على أقراص دوارة. ونظرًا لهيكلها الميكانيكي، يُقاس زمن انتقالها بالمللي ثانية، وأداء القراءة/الكتابة العشوائية لها أقل بكثير من أداء أقراص الحالة الصلبة. تكمن ميزتها في التكلفة.
| الميزة | SSD | محرك الأقراص الصلبة |
|---|---|---|
| مبدأ العمل | تعتمد على ذاكرة فلاش، لا توجد أجزاء متحركة | يقوم الرأس المغناطيسي بالقراءة/الكتابة على أقراص دوارة، والأجزاء المتحركة المعنية |
| الكمون | مستوى الميكروثانية | مستوى الميلي ثانية |
| أداء القراءة/الكتابة العشوائية | عالية جدًا (IOPS أعلى بمئات المرات من الأقراص الصلبة) | منخفضة نسبيًا |
| التكلفة لكل تيرابايت | ما يقرب من 10 إلى 20 ضعف أقراص التخزين الصلبة (HDD) | منخفضة نسبيًا |
| السعة القصوى لكل محرك أقراص | الوصول إلى مستوى 128 تيرابايت إلى 245 تيرابايت | الوصول إلى 32 تيرابايت وما فوق (تقنية HAMR) |
| كفاءة الطاقة | الطاقة لكل تيرابايت أقل بكثير من الأقراص الصلبة | دوران مستمر، استهلاك طاقة أعلى نسبيًا |
وفقاً ل بيانات VDURA اعتبارًا من الربع الأول من عام 2026، بلغت التكلفة لكل وحدة سعة 30 تيرابايت من أقراص الحالة الصلبة QLC للمؤسسات 22.6 ضعف تكلفة أقراص التخزين الصلبة من نفس السعة. ارتفع سعر محركات أقراص الحالة الصلبة TLC للمؤسسات بسعة 30 تيرابايت من حوالي 1 تيرابايت 7 تيرابايت3,062 to حول $17,500 دولار خلال العام الماضي، بينما ارتفعت أسعار أقراص التخزين الصلبة بحوالي 35% فقط خلال الفترة نفسها. هذه الفجوة تجعل حلول أقراص الحالة الصلبة النقية غير ميسورة التكلفة بشكل متزايد.
تُظهر نمذجة VDURA لتكوين مركز بيانات نموذجي أنه على مدار دورة حياة مدتها ثلاث سنوات، تبلغ التكلفة الإجمالية لملكية نظام التخزين الهجين حوالي $7.31 مليون دولار، في حين يكلف نظام SSD خالصًا حوالي $31.06 مليون دولار. وتبلغ تكلفة الحل الهجين لمدة ثلاث سنوات حوالي ربع تكلفة حل أقراص الحالة الصافية. باختصار، توفر أقراص SSD السرعة، بينما توفر محركات الأقراص الصلبة السعة والتحكم في التكلفة. كلاهما له قيمة لا يمكن الاستغناء عنها، لذا فإن النشر الهجين هو في الأساس خيار حتمي لمراكز البيانات اليوم.
منطق اختيار التخزين لعمليات الذكاء الاصطناعي الأساسية
مرحلة إعداد البيانات معالجة البيانات الأولية. تتضمن هذه المرحلة في المقام الأول القراءات المتسلسلة واسعة النطاق، والتي لا تتطلب أداءً عاليًا للقراءة/الكتابة العشوائية ولكنها تتطلب سعة كبيرة. تعتمد الممارسة الصناعية في الغالب على حلول التخزين القائمة على الأقراص الصلبة (HDD)، مدعومة ببعض أقراص التخزين المؤقت SSD لتحسين سرعة الوصول إلى البيانات الساخنة.
مرحلة تدريب النموذج أعلى متطلبات أداء التخزين. وتتطلب العملية بأكملها قراءة مستمرة لعينات التدريب الضخمة والكتابة المتكررة لملفات نقاط التحقق من النماذج، مما يؤدي إلى متطلبات إنتاجية عالية للغاية للبيانات. إذا تم استخدام محركات الأقراص الصلبة كمخزن أساسي، فإن زمن التأخير المتأصل فيها سيؤدي إلى تأخر إمداد البيانات عن حساب وحدة معالجة الرسومات، مما يؤدي مباشرةً إلى دورات حوسبة خاملة وانخفاض كبير في استخدام الأجهزة. ولذلك، في مجموعات التدريب، يتم نشر محركات أقراص NVMe SSD على خوادم وحدة معالجة الرسومات محليًا وفي مجموعات التخزين المشتركة. تُستخدم تقنيات مثل RDMA وNVMe-oF لبناء أنظمة ملفات متوازية، مما يوفر تدفقاً مستمراً للبيانات لمجموعات وحدات معالجة الرسومات المتعددة.
مرحلة الخدمة الاستدلالية متطلبان أساسيان: زمن استجابة منخفض وقدرة عالية على التزامن. تولد تطبيقات النماذج اللغوية الكبيرة السائدة وخدمات التوليد المعزز بالاسترجاع (RAG) عددًا كبيرًا من طلبات التخزين المؤقت KV واسترجاع المتجهات. تتسم هذه الأنواع من الوصول إلى البيانات بأنها عشوائية للغاية وحساسة لوقت الاستجابة، وبالتالي يجب تشغيلها على محركات أقراص الحالة الصلبة. يتم أيضًا نشر أوزان النماذج وقواعد البيانات المتجهة المستخدمة في الاستدلال بشكل كامل على محركات أقراص NVMe SSD لضمان سرعة وقت الوصول إلى الرمز الأول واستقرار الخدمة بشكل عام. تلعب محركات الأقراص الصلبة دورًا داعمًا فقط في الاستدلال وتخزين السجلات التاريخية وقواعد المعرفة التي لا يتم الوصول إليها بشكل متكرر وملفات النسخ الاحتياطية - فهي لا تشارك في خدمات الواجهة الأمامية في الوقت الفعلي.
بنية التخزين متعدد المستويات
تعتمد جميع مراكز بيانات الذكاء الاصطناعي الناضجة اليوم بنية تخزين متدرجة. يتم تقسيم البيانات إلى ثلاثة مستويات - الساخنة والدافئة والباردة - بناءً على تردد الوصول ومتطلبات الأداء، ويتغير تكوين الأجهزة وفقًا لذلك لتحقيق التوازن بين الأداء والتكلفة.
- الطبقة الساخنة هو الجزء الأعلى أداءً في الهيكل، بما في ذلك الذاكرة وذاكرة وحدة معالجة الرسومات ذات النطاق الترددي العالي، ومحركات أقراص NVMe SSD المحلية في الخوادم. لا تمثل سعتها الإجمالية سوى 51 تيرابايت إلى 201 تيرابايت إلى 6 تيرابايت من إجمالي مساحة التخزين. يخزن هذا المستوى أوزان النموذج وذاكرة التخزين المؤقت في الوقت الحقيقي وبيانات التدريب المستخدمة بشكل متكرر. وهو يحدد مباشرةً كفاءة وحدة معالجة الرسومات وهو الرابط الأساسي الذي يضمن التشغيل السلس لأعباء عمل الذكاء الاصطناعي.
- الطبقة الدافئة تستخدم عادةً محركات أقراص QLC NVMe SSD عالية السعة NVMe أو محركات الأقراص الصلبة عالية الأداء، وفي بعض الحالات مصفوفات الأقراص الصلبة التي يتم تسريعها بواسطة ذاكرة التخزين المؤقت SSD. وهي تخزّن البيانات التي يتم الوصول إليها بشكل معتدل مثل مجموعات البيانات التي تم تنظيفها وملفات النماذج شائعة الاستخدام، مما يحقق التوازن بين الأداء والسعة والتكلفة.
- الطبقة الباردة تشغل أكثر من 80% من سعة التخزين في مركز البيانات. وتتكون أجهزتها الأساسية من مصفوفات الأقراص الصلبة الخاصة بالمؤسسات؛ كما تتضمن بعض المجموعات الكبيرة جدًا مكتبات الأشرطة. وهي مخصصة لتخزين البيانات الباردة التي نادرًا ما يتم الوصول إليها مثل الشركات الخام والبيانات منتهية الصلاحية والنسخ الاحتياطية الكاملة، مما يزيد من التحكم في تكاليف النشر الإجمالية.
حالة الصناعة واتجاهات التكنولوجيا
فيما يتعلق بحصة السعة الإجمالية، لا تزال محركات الأقراص الصلبة تمثل حوالي 801 تيرابايت و6 تيرابايت من إجمالي سعة التخزين في مراكز بيانات الذكاء الاصطناعي اليوم، وهي بمثابة الأساس للبيانات الضخمة. على الرغم من أن محركات أقراص الحالة الصلبة SSD تتفوق في الأداء، إلا أن حصتها من السعة تظل محدودة نسبيًا بسبب قيود التكلفة. بالنظر إلى اتجاهات النمو، فإن الازدهار في صناعة الذكاء الاصطناعي يدفع الطلب على كلا النوعين من منتجات التخزين. ومع ذلك، فإن معدل النمو السنوي المركب ل محركات أقراص SSD للمؤسسات أعلى بكثير من أقراص التخزين الصلبة؛ مما يعكس الدور الأساسي للتخزين عالي الأداء في سيناريوهات الذكاء الاصطناعي.
مع تطور تكنولوجيا ذاكرة الفلاش، أصبحت محركات أقراص التخزين ذات الحالة الثابتة QLC ذات السعة الكبيرة أكثر انتشارًا وتزحف تدريجيًا على أسواق البيانات الدافئة التي كانت في السابق ملكًا لمحركات الأقراص الصلبة. بدأت بعض البيانات التي يتم الوصول إليها بشكل معتدل في الانتقال إلى تخزين أقراص SSD. ولكن على المدى الطويل، لن يتم استبدال محركات الأقراص الصلبة بالكامل. في سيناريوهات أرشفة البيانات الباردة على نطاق بيتابايت أو إكسابايت، تظل محركات الأقراص الصلبة غير قابلة للاستبدال بسبب تكلفتها لكل وحدة سعة، في حين أن محركات أقراص الحالة الصلبة - المقيدة بخصائصها المادية وأسعارها - من غير المرجح أن تستحوذ على التخزين الأرشيفي ذي السعة الكبيرة بشكل كامل. سيكون التعايش طويل الأجل بين هذين النوعين من الأجهزة، والعمل معًا بطريقة متدرجة، هو نموذج التخزين السائد لمراكز بيانات الذكاء الاصطناعي في المستقبل.
لا تُعد محركات أقراص الحالة الصلبة ومحركات الأقراص الصلبة بدائل متنافسة، بل هي مكونات مكملة في بنية التخزين لمراكز بيانات الذكاء الاصطناعي. تتعامل محركات أقراص الحالة الصلبة القائمة على NVMe مع أعباء العمل الأساسية عالية الأداء، مما يسمح بإطلاق العنان لحوسبة الذكاء الاصطناعي بالكامل. تحتفظ محركات الأقراص الصلبة للمؤسسات بسعة كبيرة وتكلفة منخفضة، مما يستوعب احتياجات التخزين للبيانات الضخمة. يوازن نموذج النشر الهجين المتدرج بين الأداء والسعة والتكلفة، وهي العوامل الثلاثة الأساسية. إنه حل التخزين الأكثر منطقية لمراكز بيانات الذكاء الاصطناعي اليوم وسيظل كذلك في المستقبل المنظور.





