قرص SSD للذكاء الاصطناعي: ثورة تخزين ولدت لأعباء عمل الذكاء الاصطناعي

لفترة طويلة، كان دور أقراص SSDs واضحًا نسبيًا. كانت مهمتها الأساسية هي استبدال محركات الأقراص الصلبة الميكانيكيةوتحسين الاستجابة الكلية وإنتاجية البيانات للنظام. سواءً في أجهزة الكمبيوتر الاستهلاكية أو خوادم المؤسسات أو مراكز البيانات، كان التطور التكنولوجي لمحركات أقراص الحالة الصلبة يدور بشكل أساسي حول عدة أهداف ثابتة: سرعات قراءة/كتابة تسلسلية أعلى، وسعة أكبر، وتكلفة أقل، وموثوقية أفضل. ومع ذلك، مع التطور السريع للذكاء الاصطناعي، وخاصة النماذج الكبيرة والتعلم العميق، تغيرت أعباء العمل التي تواجهها أنظمة التخزين بشكل كبير. في سيناريوهات الذكاء الاصطناعي، لم تعد البيانات ببساطة "تُقرأ وتُعالج وتُكتب". وبدلاً من ذلك، فإنها تُظهر العديد من الخصائص الجديدة:
رأس مقالة AI SSD img 1400 AI SSD: ثورة تخزين وُلدت لأحمال عمل الذكاء الاصطناعي
أولاً، انفجر حجم البيانات. سواءً كانت البيانات الأولية الضخمة المستخدمة في مرحلة تدريب النموذج أو معلمات النموذج وقواعد بيانات المتجهات التي تحتاج إلى وصول متكرر أثناء مرحلة الاستدلال، فإن حجم البيانات يتجاوز بكثير حجم التطبيقات التقليدية.
ثانياً، تغير نمط الوصول بشكل أساسي. غالبًا ما تتضمن أعباء عمل الذكاء الاصطناعي عددًا كبيرًا من عمليات الوصول إلى كتل البيانات الصغيرة والعشوائية وعالية التسلسل، بدلاً من عمليات القراءة والكتابة المتسلسلة ذات الكتل الكبيرة التي تتقن أنظمة التخزين التقليدية التعامل معها.
ثالثًا، بدأ التخزين يؤثر بشكل مباشر على الكفاءة الحسابية. في خوادم الذكاء الاصطناعي، تتزايد قوة الحوسبة لوحدات معالجة الرسومات أو المسرعات الأخرى بسرعة كبيرة. إذا لم يتمكن نظام التخزين من مواكبة سرعة توريد البيانات، يحدث "تباطؤ في الحوسبة"، مما يقلل في الواقع من كفاءة النظام الكلية.
في ظل هذه الخلفية بدأ ذكر مفهوم الذكاء الاصطناعي للذكاء الاصطناعي SSD بشكل متكرر وانتقل تدريجياً من المفهوم إلى منتجات محددة وخرائط طريق تقنية.

ما هو الذكاء الاصطناعي SSD؟

بالنسبة للعديد من القادمين الجدد إلى هذا المفهوم، يمكن بسهولة إساءة فهم "محرك الأقراص ذي الحالة الصلبة بالذكاء الاصطناعي" على أنه منتج يدمج خوارزميات الذكاء الاصطناعي داخل محرك الأقراص ذي الحالة الصلبة، قادر على "التعلم" أو "التحسين" من تلقاء نفسه. ومع ذلك، وفقًا لتعريف الصناعة السائد، فإن هذا الفهم غير دقيق. لا يتعلق جوهر الذكاء الاصطناعي SSD بـ "ما إذا كان هناك ذكاء اصطناعي داخل محرك الأقراص ذي الحالة الصلبة"، بل يتعلق بـ "ما إذا كان محرك الأقراص ذي الحالة الصلبة قد وُلد لأعباء عمل الذكاء الاصطناعي". وبشكل أكثر دقة، فإن محرك أقراص SSD للذكاء الاصطناعي هو نوع من أجهزة التخزين ذات الحالة الصلبة المحسّنة بعمق لسيناريوهات التدريب والاستدلال وخدمة البيانات في الذكاء الاصطناعي. ويشمل هذا التحسين كلاً من تصميم البنية على مستوى الأجهزة والتغييرات في البرامج الثابتة والبروتوكولات وأساليب تعاون النظام. من حيث الموضع الوظيفي، لا يزال الذكاء الاصطناعي SSD جهاز تخزين؛ فهو لن يحل محل الدور الحسابي لوحدات معالجة الرسومات أو وحدات المعالجة المركزية. ولكن هدفه واضح للغاية: تقليل قيود الأداء التي يفرضها التخزين على أنظمة الذكاء الاصطناعي.

الاختناقات العملية لمحركات أقراص الحالة الصلبة التقليدية في سيناريوهات الذكاء الاصطناعي

لفهم قيمة محركات الأقراص ذات الحالة الثابتة للذكاء الاصطناعي، يجب أولاً أن يكون المرء على دراية بالمشاكل التي تواجهها محركات الأقراص ذات الحالة الثابتة التقليدية في سيناريوهات الذكاء الاصطناعي.
oscoo 2b لافتة 1400 × 475 1 AI SSD: ثورة تخزين ولدت لأحمال عمل الذكاء الاصطناعي
  1. يصبح الكمون مقياساً أكثر أهمية من عرض النطاق الترددي.في التطبيقات التقليدية, قراءة/كتابة متسلسلة غالبًا ما يكون عرض النطاق الترددي مؤشرًا مهمًا لتقييم أداء محرك أقراص الحالة الصلبة، مثل 7 جيجابايت/ثانية أو 14 جيجابايت/ثانية. ولكن في سيناريوهات الذكاء الاصطناعي، غالبًا ما تتجاوز أهمية زمن الوصول إلى سرعة الاستجابة ذروة عرض النطاق الترددي. وذلك لأن مهام الذكاء الاصطناعي تنطوي على عدد كبير من طلبات البيانات الدقيقة. إذا كان كل وصول يتطلب الانتظار لعشرات الميكروثانية، حتى لو كانت كمية البيانات لكل طلب صغيرة، فإن التأثير التراكمي سيؤدي إلى إبطاء التقدم الكلي بشكل كبير. يتراوح زمن الوصول النموذجي للعديد من محركات أقراص الحالة الصلبة الخاصة بالمؤسسات بين 40-100 ميكروثانية، وهو أمر مقبول في سيناريوهات قواعد البيانات أو المحاكاة الافتراضية، ولكنه يبدو مرتفعًا نسبيًا في الاستدلال أو التدريب على الذكاء الاصطناعي على نطاق واسع.
  2. لم يعد IOPS مجرد "جيد بما فيه الكفاية". لطالما كان IOPS (عمليات الإدخال/الإخراج في الثانية) أحد المقاييس الأساسية لمخزونات أقراص الحالة الصلبة (SSD)، ولكن في الأعمال التقليدية، كان الوصول إلى مئات الآلاف من IOPS كافياً في كثير من الأحيان. أعباء عمل الذكاء الاصطناعي مختلفة تمامًا. تولد سيناريوهات مثل استرجاع المتجهات وتحميل المعلمات والوصول إلى تقاسم النماذج عددًا كبيرًا للغاية من طلبات القراءة العشوائية. في مثل هذه الحالات، سرعان ما تصبح وحدات IOPS لمحركات أقراص الحالة الصلبة التقليدية عنق زجاجة النظام. هذا هو السبب في أن المناقشات حول تقنية محركات أقراص SSD للذكاء الاصطناعي غالبًا ما تشير إلى أهداف بملايين أو حتى عشرات الملايين من IOPS، وهو أمر نادر جدًا في الماضي.
  3. تصبح وحدة المعالجة المركزية "عنق الزجاجة للنقل". في بنية الخادم الكلاسيكية، عادةً ما يكون مسار البيانات بين SSD ووحدة معالجة الرسومات: SSD ← وحدة المعالجة المركزية ← وحدة المعالجة المركزية ← الذاكرة ← وحدة معالجة الرسومات. كان هذا النموذج يعمل بشكل جيد في عصر الحوسبة للأغراض العامة ولكنه يكشف عن مشاكل واضحة في خوادم الذكاء الاصطناعي. فمن ناحية، تحتاج وحدة المعالجة المركزية إلى التعامل مع قدر كبير من حركة البيانات؛ ومن ناحية أخرى، يقدم هذا المسار نفسه زمن انتقال إضافي. ومع استمرار ازدياد قوة حوسبة وحدة معالجة الرسومات (GPU)، فإن مسار البيانات هذا الذي "يلتف حول وحدة المعالجة المركزية للوصول إلى وحدة معالجة الرسومات" أصبح قيدًا على كفاءة النظام الكلية.

اختلافات التموضع بين محرك الأقراص ذي الحالة الثابتة للذكاء الاصطناعي ومحرك الأقراص ذي الحالة الثابتة التقليدي

ولفهم الفرق بين الاثنين بشكل أكثر بديهية، يمكننا المقارنة بينهما من منظور "نقطة انطلاق التصميم".
بُعد المقارنة أقراص SSD تقليدية قرص SSD للذكاء الاصطناعي
الهدف الأساسي التوازن بين الأداء للأغراض العامة والتكلفة الكفاءة القصوى لأعباء عمل الذكاء الاصطناعي
التركيز على التحسين القراءة/الكتابة المتتابعة، والقدرة، والموثوقية زمن انتقال منخفض، و IOPS مرتفع، وتوافقية عالية
التطبيقات النموذجية الكمبيوتر، الخادم، قاعدة البيانات تدريب الذكاء الاصطناعي، الاستدلال، البحث في المتجهات
نمط الوصول إلى البيانات مختلط، متسلسل في المقام الأول كتلة صغيرة وعشوائية وعالية التحويلات المالية
تعاون النظام تتمحور حول وحدة المعالجة المركزية أقرب إلى وحدة معالجة الرسومات/المسرّع
من المهم التأكيد على أن محركات أقراص الحالة الصلبة للذكاء الاصطناعي لا تهدف إلى استبدال محركات أقراص الحالة الصلبة التقليدية. في الغالبية العظمى من سيناريوهات الأغراض العامة، تظل محركات أقراص الحالة الصلبة التقليدية خيارًا أكثر منطقية وفعالية من حيث التكلفة. إن وجود محركات أقراص الحالة الصلبة للذكاء الاصطناعي هو لخدمة الأنظمة التي "يتم دفعها بالفعل إلى أقصى حد" بواسطة أعباء عمل الذكاء الاصطناعي.

الوضع الأساسي للذكاء الاصطناعي SSD

من من منظور النظام، يمكن تلخيص الدور الأساسي لمخزونات الحالة الصلبة للذكاء الاصطناعي في جملة واحدة: لا تتمثل مهمتها في تخزين البيانات نفسها فحسب، بل في توفير البيانات لوحدة حوسبة الذكاء الاصطناعي بكفاءة وثبات واستمرارية. لتحقيق هذا الهدف، تركز أقراص SSD للذكاء الاصطناعي عادةً على التحسين في الاتجاهات التالية:

  • زمن وصول منخفض للغاية
  • قدرة عالية جداً على IOPS عشوائية عالية جداً
  • بنية داخلية أكثر ملاءمة لأنماط الوصول إلى بيانات الذكاء الاصطناعي
  • أساليب تعاون أكثر إحكامًا على مستوى النظام
لا تتحقق هذه الخصائص بمجرد تكديس المعلمات، بل تتطلب في كثير من الأحيان إعادة التفكير في تصميم وحدة التحكم في محرك أقراص الحالة الصلبة واستراتيجيات إدارة ذاكرة الفلاش وحتى طرق واجهة النظام.

الميزات التقنية الرئيسية والمقاربات المعمارية للذكاء الاصطناعي SSD

لا يتعلق محرك أقراص الحالة الصلبة للذكاء الاصطناعي SSD ببساطة بأخذ محرك أقراص الحالة الصلبة الحالي للمؤسسات، وتعزيز أداء وحدة التحكم، وإضافة المزيد من ذاكرة الفلاش، وزيادة سرعة الواجهة لتناسب سيناريوهات الذكاء الاصطناعي بشكل طبيعي. تكمن الصعوبة الحقيقية في الاختلاف الهيكلي بين أنماط الوصول لأعباء عمل الذكاء الاصطناعي وتطبيقات التخزين التقليدية. إن التطور التكنولوجي لمحرك أقراص الحالة الصلبة للذكاء الاصطناعي هو في الأساس إعادة تصميم يتمحور حول أنماط الوصول إلى البيانات.

زمن انتقال منخفض للغاية

في أنظمة الذكاء الاصطناعي، غالبًا ما يحدد زمن انتقال التخزين بشكل مباشر معدل استخدام موارد الحوسبة. إذا أخذنا وحدة معالجة الرسومات كمثال، فإن قوتها الحاسوبية تتزايد بشكل أسرع بكثير من أنظمة التخزين. إذا كانت وحدة معالجة الرسومات في وضع الخمول أثناء انتظار البيانات، فحتى لو كانت قوة الحوسبة النظرية لوحدة معالجة الرسومات عالية، فإن الإنتاجية الفعلية ستنخفض بشكل كبير. في هذه الحالة، لا يكفي متوسط زمن الوصول إلى البيانات؛ بل إن زمن الوصول إلى الذيل أكثر أهمية. يمكن أن تؤدي عملية إدخال/إخراج واحدة ذات زمن انتقال غير طبيعي إلى إبطاء تنفيذ دفعة كاملة.
عادةً ما يكون زمن وصول محركات أقراص NVMe SSD التقليدية للمؤسسات في مستوى عشرات الميكروثانية، وهي نتيجة ناضجة ومستقرة للغاية. ولكن في سيناريوهات الذكاء الاصطناعي، تحاول الصناعة زيادة ضغط زمن الوصول إلى مستوى عشرة ميكروثانية أو حتى ما يقرب من ميكروثانية أحادية الرقم. ولا يقتصر تحقيق ذلك على زيادة سرعة الواجهة فحسب، بل يتطلب تحسينًا منهجيًا في المجالات التالية:
  • تقليل المقاطعات ومفاتيح تبديل السياق في مسار التحكم
  • تحسين استراتيجيات جدولة الوصول إلى ذاكرة الفلاش
  • تقصير مسار المعالجة الداخلية للبيانات داخل وحدة التحكم
يمكن القول إن تحسين وقت الاستجابة هو مشروع منهجي يعمل من خلال عملية تصميم محرك أقراص SSD للذكاء الاصطناعي بالكامل.

طاقة تشغيل عالية جداً IOPS

أثناء التدريب والاستدلال على النماذج، غالبًا ما يُظهر الوصول إلى البيانات خصائص "مجزأة". على سبيل المثال:
  • تنقسم معلمات النموذج إلى العديد من الكتل الصغيرة.
  • تتطلب قواعد البيانات المتجهة الوصول المتكرر إلى الفهارس والميزات.
  • يتم تشغيل نماذج أو مهام متعددة على التوازي.
في هذه السيناريوهات، لا يواجه قرص SSD عددًا قليلاً من الطلبات الكبيرة والمستمرة، بل عددًا هائلاً من الطلبات الصغيرة المتزامنة. وهذا يجعل IOPS مؤشرًا رئيسيًا يحدد سقف الأداء. في محركات أقراص الحالة الصلبة SSD التقليدية للمؤسسات، تعتبر عدة مئات الآلاف من IOPS عالية الأداء بالفعل. أما في تخطيط محركات أقراص الحالة الصلبة للذكاء الاصطناعي، فإن الأهداف الشائعة هي ملايين أو عدة ملايين أو حتى عشرات الملايين من IOPS. من المهم أن نلاحظ أن IOPS المشار إليها هنا ليست مجرد قيمة ذروة في ظل الظروف المعملية، بل هي قدرة مستدامة في ظل قيود التزامن العالي والكمون المنخفض. إن تحسين IOPS ليس مشكلة يمكن حلها ببساطة عن طريق "فتح المزيد من قوائم الانتظار". عندما يكون عدد الطلبات المتزامنة كبيراً للغاية، تظهر المشاكل التالية بسرعة:
  • زيادة تعقيد إدارة قائمة الانتظار
  • تحميل غير متساوٍ بين قنوات ذاكرة فلاش
  • التداخل من تضخيم الكتابة وجمع القمامة
لذلك، غالبًا ما تحتاج محركات أقراص الحالة الصلبة للذكاء الاصطناعي إلى تقديم استراتيجيات جدولة متزامنة أكثر قوة على مستوى البرامج الثابتة، مع إدارة موارد ذاكرة الفلاش بشكل أكثر دقة.

التصميم المشترك للنظام لوحدات معالجة الرسومات والمسرعات

في البنية الكلاسيكية للخوادم، لا يوجد عادةً مسار بيانات مباشر بين SSD ووحدة معالجة الرسومات. يجب أن تمر البيانات أولاً عبر وحدة المعالجة المركزية وذاكرة النظام قبل إرسالها إلى وحدة معالجة الرسومات. تتضخم مشاكل هذه البنية في خوادم الذكاء الاصطناعي. مع زيادة عدد وحدات معالجة الرسومات واستمرار تحسن قوة الحوسبة أحادية البطاقة في التحسن، تصبح مشاكل الكفاءة في هذا المسار غير المباشر أكثر وضوحاً. ولحل هذه المشكلة، بدأت خوادم الذكاء الاصطناعي ذات محركات الأقراص الصلبة للذكاء الاصطناعي في القيام بمحاولات جديدة على مستوى النظام، مثل:
  • دعم أوضاع الوصول المباشر أو شبه المباشر إلى البيانات بوحدة معالجة الرسومات.
  • تقليل مشاركة وحدة المعالجة المركزية غير الضرورية.
  • تحسين مسار نقل البيانات بين التخزين والمسرعات.
لا تعني هذه التصاميم بالضرورة تجاوز وحدة المعالجة المركزية بالكامل، بل تعني تقليل أوقات نسخ البيانات ونقلها في السيناريوهات المناسبة لتحسين الكفاءة الكلية. في هذه البنية، لم يعد التخزين في هذه البنية مجرد "مستودع بيانات سلبي"، بل أصبح أشبه بعقدة خدمة بيانات نشطة داخل نظام الذكاء الاصطناعي. فهو يحتاج إلى فهم أنماط الوصول إلى المستوى الأعلى، والاستجابة بسرعة للطلبات المتزامنة، وتشكيل تعاون فعال مع وحدات الحوسبة. وهذا هو السبب أيضًا في أن تصميم محركات أقراص التخزين ذات الحالة الصلبة للذكاء الاصطناعي غالبًا ما يتطلب تعاونًا عميقًا مع نظام الآلة بأكمله، وحتى مع مصنعي وحدات معالجة الرسومات.

سعة كبيرة وكثافة عالية

مع استمرار نمو أحجام معلمات النماذج الكبيرة، حيث تصل أحجام النماذج الفردية في كثير من الأحيان إلى مئات الجيجابايت أو حتى عدة تيرابايت، يجب أن تتمتع أنظمة التخزين بسعة وكثافة كافية لدعم النشر الفعلي. علاوةً على ذلك، غالبًا ما تحتاج أنظمة الذكاء الاصطناعي إلى تخزين إصدارات متعددة من النماذج وبيانات التدريب والنتائج الوسيطة وقواعد البيانات المتجهة والفهارس وما إلى ذلك. وهذا يجعل السعة العالية والكثافة العالية سمة مهمة أخرى من سمات محركات أقراص الحالة الصلبة للذكاء الاصطناعي. ومع ذلك، فإن السعة العالية ليست "مجانية". فغالبًا ما تأتي زيادة كثافة الفلاش مصحوبة بتكاليف:
  • زيادة زمن انتقال الوصول لكل قالب فلاش.
  • أداء متزامن محدود.
  • تحديات التحمل والموثوقية.
لذلك، أثناء السعي وراء السعة، تحتاج محركات أقراص الحالة الصلبة للذكاء الاصطناعي أيضًا إلى تقليل فقدان الأداء الناجم عن الكثافة العالية من خلال التصميمات المعمارية والجدولة.

حالة الصناعة والاتجاهات المستقبلية للذكاء الاصطناعي SSD

إذا نظرنا إلى الأمر من منظور دورة حياة التكنولوجيا، فإن الذكاء الاصطناعي SSD لا يزال في مرحلة "التبني المبكر والاستكشاف السريع". فمن ناحية، لا يعد الذكاء الاصطناعي SSD مجرد مصطلح تسويقي لا يزال على المستوى المفاهيمي؛ فأحمال عمل الذكاء الاصطناعي موجودة بالفعل وتنمو بسرعة في مراكز البيانات ومنصات الحوسبة السحابية والمؤسسات الكبيرة. من ناحية أخرى، لم تشكل محركات أقراص SSD للذكاء الاصطناعي بعد شكل منتج موحد وموحد تمامًا. لا تزال محركات أقراص الحالة الصلبة الحقيقية المصممة بالكامل حول الذكاء الاصطناعي تقتصر بشكل أساسي على المنتجات المخصصة والمخصصة قبل البحث والمنتجات المؤسسية المتطورة، وهي بعيدة بعض الشيء عن الاعتماد على نطاق واسع.
مع تقدم الذكاء الاصطناعي لمحركات أقراص الحالة الصلبة SSD، تتغير الأدوار داخل سلسلة صناعة التخزين التقليدية. في الماضي، كانت الشركات المصنعة لأقراص SSD تركز أكثر على أداء وموثوقية الأجهزة الفردية. أما في سيناريو الذكاء الاصطناعي، فهم بحاجة إلى المشاركة في وقت مبكر في التصميم على مستوى النظام، والتعاون مع الخادم ووحدة معالجة الرسومات وموفري المنصات السحابية، وإجراء تحسينات عميقة لأعباء عمل محددة للذكاء الاصطناعي. يؤدي هذا الأمر إلى طمس الحدود بين الشركات المصنعة لمعدات التخزين الأصلية والشركات المصنعة لوحدات التحكم وشركات تكامل الأنظمة.
من المرجح ألا تكون محركات أقراص SSD المستقبلية للذكاء الاصطناعي مجرد "جهاز موصول بفتحة PCIe"، بل ستكون مصممة بشكل أعمق مع موارد الحوسبة على مستوى النظام. قد ينعكس هذا في: المزيد من مسارات البيانات المباشرة، وعدد أقل من النسخ الوسيطة، وتعاون أكثر إحكاماً بين البرامج والأجهزة. سيؤدي ذلك إلى زيادة إضعاف الحدود بين التخزين والحوسبة. من ناحية أخرى، مع توسع أنظمة الذكاء الاصطناعي، فإن "تسليم جميع العمليات الحسابية إلى وحدة معالجة الرسومات" ليس بالضرورة الحل الأمثل. في بعض السيناريوهات، يمكن أن يساعد تكليف جهاز التخزين بمعالجة بعض مهام معالجة البيانات أو المعالجة المسبقة في تقليل الحمل الكلي للنظام. وعلى الرغم من أن مثل هذه الأفكار لا تزال في مرحلة الاستكشاف، إلا أنها أصبحت محط اهتمام الصناعة.
لا يمثل محرك أقراص SSD للذكاء الاصطناعي نوعًا جديدًا يغير ماهية التخزين بشكل أساسي، ولكنه إعادة تشكيل لدور التخزين الذي يتمحور حول أعباء عمل الذكاء الاصطناعي. وينبع ظهوره من التغييرات الأساسية التي يجلبها الذكاء الاصطناعي لأنماط الوصول إلى البيانات؛ ولا تكمن قيمته في التحسين المبالغ فيه للمقاييس الفردية، بل في التحسين المستمر لكفاءة النظام؛ ولن يحل مستقبله محل جميع أقراص SSD، ولكنه سيصبح جزءًا لا غنى عنه في البنية التحتية للذكاء الاصطناعي. إذا كانت وحدة معالجة الرسومات هي "محرك" نظام الذكاء الاصطناعي، فإن محرك أقراص الحالة الصلبة للذكاء الاصطناعي هو أشبه بنظام الوقود الذي يوفر إمدادًا مستقرًا ومستمرًا. قد لا يكون الأكثر بروزًا، ولكن بمجرد تعطله، يتأثر النظام بأكمله.
滚动至顶部

يمكن الاتصال بنا

املأ النموذج أدناه، وسنتواصل معك قريباً.

منتج نموذج الاتصال