هل سبق لك أن شعرت بالإحباط بسبب نفاد ذاكرة الكمبيوتر دون أن تتمكن من إضافة المزيد منها بنفس سهولة توصيل محرك أقراص USB? وقد وُلدت تقنية CXL لحل هذه المشكلة. فهي تعمل كنظام “توسيع خارجي” للذاكرة، مما يتيح للخوادم أو محطات العمل إضافة كميات كبيرة من الذاكرة الخارجية بمرونة عبر كابلات مخصصة وبطاقات توسعة، بل ويسمح لعدة أجهزة بمشاركة مجموعة ذاكرة مشتركة. بفضل تقنية CXL، أصبحت ذاكرة النظام بسعة 1 تيرابايت – التي كانت في السابق متاحة فقط في أجهزة الكمبيوتر المركزية باهظة الثمن – شائعة بشكل متزايد في الحوسبة عالية الأداء والذكاء الاصطناعي.
لماذا ظهرت CXL؟
يمكننا تصور ذاكرة الخادم التقليدية على أنها مبنى سكني ضخم يحتوي على خزائن تخزين فردية: فكل غرفة (كل خادم) لها مساحة تخزين خاصة بها، لكن حجم تلك المساحة يكون ثابتًا منذ لحظة انتقالك إليها، وحتى لو كانت خزانة جارك فارغة، فلا يمكنك استعارتها. مع نمو الذكاء الاصطناعي والحوسبة السحابية والبيانات الضخمة، بدأ هذا النموذج يظهر ثلاث مشكلات خطيرة.
عندما تنفد فتحات الذاكرة الفعلية، لا يمكنك إضافة المزيد من الذاكرة. عدد فتحات الذاكرة في كل لوحة أم للخادم محدود، وعادةً ما يكون ثماني أو اثنتي عشرة أو ست عشرة فتحة. وحتى إذا قمت بملء كل فتحة بوحدات ذاكرة ذات السعة الأكبر المتوفرة في السوق، فإن السعة الإجمالية ستظل محدودة. وعندما يحتاج تطبيقك إلى ذاكرة أكبر من هذا الحد الأقصى، فإن الحل الوحيد هو شراء خادم أعلى مستوى وأكثر تكلفة بدلاً من مجرد إضافة المزيد من الذاكرة إلى الجهاز الحالي.
لا يمكن مشاركة موارد الذاكرة، مما يؤدي إلى هدر كبير. في مراكز البيانات الكبيرة، غالبًا ما تصل الخوادم المختلفة إلى ذروة نشاطها في أوقات مختلفة. لكن في ظل البنية التقليدية، لا يمكن للخوادم التي تحتاج إلى موارد الذاكرة الخاملة هذه “استعارتها”. وتُظهر إحصاءات القطاع أن معدل استخدام الذاكرة في مراكز البيانات غالبًا ما يقل عن خمسين بالمائة، مما يعني أن ما يقرب من نصف الاستثمارات في الأجهزة تظل دون استغلال.
ولمواجهة الطلب المفاجئ، تضطر الشركات إلى الإفراط في الاستثمار. عندما يحتاج مشروع ما أحيانًا إلى ضعف سعة الذاكرة العادية، فإن الحل التقليدي يتمثل في شراء أجهزة تلبي احتياجات الذروة. ويتم إنفاق هذه الأموال على سعة تظل غير مستخدمة معظم الوقت. وبمجرد تركيب وحدات الأجهزة هذه، لا يمكن إعادة توزيعها بمرونة بين المشاريع المختلفة أو توسيعها بسهولة مع نمو الأعمال.
كان الهدف هو حل المشاكل الثلاث دفعة واحدة – القدرة المادية المحدودة، وعدم القدرة على تقاسم الموارد، وضعف كفاءة الاستثمار – أن المهندسين هم من صمموا تقنية CXL. فهي تغير بشكل جذري الطريقة التي تتصل بها الذاكرة بوحدات الحوسبة، وتحوّل الذاكرة إلى مورد يمكن توصيله حسب الحاجة وتخصيصه ديناميكيًا.
ما هو CXL وكيف يعمل؟
CXL هو بروتوكول اتصال مفتوح يعتمد على الواجهة المادية القياسية PCIe. واسمه الكامل هو رابط Compute Express, ، ويمكنك التفكير فيه على أنه مجموعة من “قواعد اللغة” التي تتيح اتصالاً عالي السرعة ومتسقاً وذو زمن انتقال منخفض بين وحدة المعالجة المركزية (CPU) وأجهزة الذاكرة الخارجية. ما يجعل CXL فريدة من نوعها هو أنها تسمح لوحدة المعالجة المركزية (CPU) بمعاملة الذاكرة الخارجية كما لو كانت جزءًا من هيكلها، بدلاً من اعتبارها جهازًا طرفيًا يتطلب مسارًا جانبيًا للوصول إليه.
تناسق ذاكرة التخزين المؤقت
تخيل السيناريو التالي: أنت وزميل لك تقومان بتحرير نفس المستند عبر الإنترنت. إذا قام كل منكما بحفظ نسخة محلية ثم أجرى تغييرات، فستواجهان تعارضات عند الدمج – أي التغييرات ستُطبق؟ تواجه ذاكرة الكمبيوتر المشكلة نفسها. يوجد داخل وحدة المعالجة المركزية (CPU) منطقة تخزين صغيرة وسريعة جدًا تسمى “ذاكرة التخزين المؤقت” (cache) تحتفظ بنسخ من البيانات المستخدمة مؤخرًا من الذاكرة الرئيسية. عندما تصل وحدة المعالجة المركزية إلى الذاكرة، فإنها تقرأ من ذاكرة التخزين المؤقت أولاً، وهو ما يعد أسرع بكثير. ولكن إذا احتوت كل من ذاكرة DDR المحلية وذاكرة CXL الخارجية على نسخ من نفس البيانات، وتم تعديل إحدى النسختين، فيجب تحديث النسخة الأخرى وفقًا لذلك. وإلا فقد تقرأ وحدة المعالجة المركزية (CPU) بيانات غير صحيحة. تسمى هذه المشكلة “تناسق ذاكرة التخزين المؤقت”. يتضمن CXL بروتوكولًا فرعيًا مخصصًا للتعامل مع هذا الأمر، حيث “يتواصل” باستمرار بين وحدة المعالجة المركزية (CPU) والذاكرة الخارجية لضمان بقاء جميع النسخ متسقة.
تجميع الذاكرة والتخصيص المرن
في النهج التقليدي، لا يمكن لكل خادم استخدام سوى الذاكرة الموجودة في فتحاته الخاصة. تقدم CXL مفهوم “التجميع”: يمكنك توصيل عدة أجهزة ذاكرة CXL بمحول CXL، لتشكيل مجموعة ذاكرة واحدة ذات سعة كبيرة، ثم السماح لعدة خوادم بـ“السحب” من هذه المجموعة حسب الحاجة. وهذا يشبه مبنى مكاتب يستبدل مبردات المياه الفردية الموجودة في كل مكتب بمحطة مياه مركزية في الردهة، حيث يحصل الجميع على الماء عند الحاجة. قد تكون السعة الإجمالية لمحطة المياه أصغر من مجموع عشرة مبردات فردية، لكنها لا تزال تلبي احتياجات الجميع لأن أوقات الذروة في الاستخدام لا تتزامن. وبالمثل، تتيح مجموعة ذاكرة CXL لمديري مراكز البيانات تخصيص الذاكرة ديناميكيًا بناءً على الحمل في الوقت الفعلي لكل خادم – حيث يتم توفير المزيد عند الانشغال واستردادها عند الخمول – وبالتالي دعم المزيد من مهام الحوسبة باستخدام أجهزة أقل إجمالاً.
ما الذي تشمله تقنية CXL؟
CXL هو حل متكامل للذاكرة يشمل كل شيء بدءًا من الأجهزة المادية وصولاً إلى تكوين البرامج. يمكنك التفكير في هذا النظام على أنه طريق سريع: الطريق نفسه (الاتصال المادي) هو مجرد الأساس؛ فأنت تحتاج أيضًا إلى قواعد المرور (بروتوكول الاتصال) للحفاظ على حركة المركبات بشكل منظم، وتحتاج إلى نظام إدارة المرور (تكوين البرامج) لتوجيه المركبات إلى وجهتها والمسار الذي يجب أن تسلكه. وفي حالة فقدان أي من هذه الطبقات، لا يمكن للطريق السريع أن يعمل بشكل حقيقي.
طبقة الأجهزة: المكونات المرئية
يشمل الجانب المادي لتقنية CXL أنواعًا مختلفة من الأجهزة، والتي تشكل معًا البنية التحتية لتوسيع الذاكرة. وأكثر الأجهزة شيوعًا هي بطاقة توسيع الذاكرة CXL، التي تشبه في شكلها بطاقة الرسومات ويمكن توصيلها مباشرةً بفتحة PCIe موجودة على اللوحة الأم للخادم. وتحتوي هذه البطاقة على شرائح ذاكرة ملحومة عليها أو فتحات مخصصة لوحدات الذاكرة. بمجرد إدخالها، يتعرف النظام على سعة الذاكرة الإضافية. وهناك شكل آخر من الأجهزة وهو وحدة ذاكرة CXL، وهي أصغر حجمًا – مثل محرك الأقراص الصلبة المدمج – ويمكن تثبيتها في فتحات محركات الأقراص المخصصة للخادم، مما يجعلها مناسبة لعمليات النشر عالية الكثافة.
عندما تحتاج إلى توصيل عدة خوادم أو عدة أجهزة ذاكرة، فإن محول CXL هو الحل الأمثل. وهو يشبه محول الشبكة، ولكن بدلاً من توجيه حزم الشبكة، فإنه يقوم بتوجيه طلبات الوصول إلى الذاكرة. من خلال محول CXL، يمكن للمسؤولين توصيل عدة بطاقات ذاكرة CXL معًا لتشكيل مجموعة ذاكرة موحدة ذات سعة كبيرة، ثم السماح لعدة خوادم بمشاركة موارد تلك المجموعة في وقت واحد. بالنسبة للمسافات الأطول، يمكن لكابلات CXL المخصصة الحفاظ على سرعة نقل عالية عبر مسافات تصل إلى عدة أمتار أو حتى عشرات الأمتار، مما يسمح بوضع أجهزة الذاكرة في حوامل مختلفة عن الخوادم.
طبقة البروتوكول: قواعد اللغة المستخدمة في الاتصال
إذا كان الجهاز هو الهيكل العظمي، فإن البروتوكول هو الروح التي تجعل كل شيء يعمل. يتضمن بروتوكول CXL ثلاثة بروتوكولات فرعية متوازية، كل منها مسؤول عن مهمة مختلفة. ويمكنها العمل في وقت واحد دون أن تتداخل مع بعضها البعض.
- يُسمى البروتوكول الفرعي الأول CXL.io, وتتمثل مهمتها في اكتشاف الأجهزة وتهيئتها. عندما تقوم بإدخال بطاقة ذاكرة CXL في الخادم،, CXL.io وهي مسؤولة عن تمكين وحدة المعالجة المركزية (CPU) من التعرف على الجهاز وقراءة معلوماته الأساسية (مثل السعة والأوضاع المدعومة) وتخصيص مساحة عناوين له. وتشبه هذه العملية إلى حد كبير توصيل بطاقة رسومات أو بطاقة شبكة.
- يُسمى البروتوكول الفرعي الثاني CXL.cache, ، وهي إحدى الميزات الأساسية لـ CXL. تعمل CXL.cache على الحفاظ على اتساق البيانات بين ذاكرة التخزين المؤقتة للوحدة المركزية للمعالجة (CPU) والذاكرة الخارجية. وكما وُضِح سابقًا، عندما تقوم وحدة المعالجة المركزية (CPU) بتعديل جزء من البيانات، تضمن CXL.cache تحديث النسخة المقابلة في الذاكرة الخارجية أيضًا، والعكس صحيح.
- يُسمى البروتوكول الفرعي الثالث CXL.mem, ، والتي تتولى عمليات قراءة وكتابة البيانات الفعلية. فعندما تحتاج وحدة المعالجة المركزية (CPU) إلى قراءة جزء من البيانات من ذاكرة CXL، تقوم CXL.mem بنقل الطلب وإرجاع البيانات؛ وعندما تحتاج وحدة المعالجة المركزية (CPU) إلى كتابة البيانات إلى ذاكرة CXL، تقوم CXL.mem بتنفيذ عملية النقل بنفس الطريقة.
طبقة البرامج: التهيئة والإدارة لضمان سير العمل
تتيح تهيئة البرامج لنظام التشغيل والتطبيقات الاستفادة الفعليّة من هذه الذاكرة الجديدة. وفي نظام BIOS، يتعين على المسؤول تمكين وظائف CXL وتخصيص الموارد. على مستوى نظام التشغيل، وبأخذ Linux كمثال، يتم التعرف على ذاكرة CXL كعقدة NUMA منفصلة، ويمكن للمسؤول استخدام الأوامر لتحديد ما إذا كان يجب أن يفضل البرنامج الذاكرة المحلية أو ذاكرة CXL. تدعم أنظمة التشغيل الحديثة أيضًا تصنيف الذاكرة، والذي يحافظ تلقائيًا على البيانات الأكثر نشاطًا في ذاكرة DDR المحلية السريعة وينقل البيانات الأقل نشاطًا إلى ذاكرة CXL. لا تحتاج الغالبية العظمى من التطبيقات إلى أي تعديل في الكود لاستخدام ذاكرة CXL، لأن نظام التشغيل يديرها تمامًا مثل الذاكرة العادية.
CXL مقابل حلول الذاكرة التقليدية
| الجانب | الحل التقليدي لنظام DDR | حل CXL |
|---|---|---|
| الحد الأقصى للسعة | يقتصر ذلك على فتحات الذاكرة في اللوحة الأم والسعة القصوى للوحدات؛ ولا يمكن التوسع أكثر من ذلك بمجرد الوصول إلى الحد الأقصى | يمكن الاستمرار في إضافة ذاكرة عبر بطاقات التوسعة أو المحولات CXL دون الحاجة إلى استبدال اللوحة الأم |
| مرونة الموارد | سعة ذاكرة كل خادم ثابتة؛ ولا يمكن إعادة توزيعها بين الخوادم | يدعم تجميع الذاكرة؛ حيث يمكن لعدة خوادم مشاركة تجمع ذاكرة مشترك عند الحاجة |
| الكفاءة من حيث التكلفة | شراء كميات كبيرة من الذاكرة لتلبية الطلب في أوقات الذروة؛ وغالبًا ما يقل معدل الاستخدام اليومي عن 50% | يدعم نفس حجم العمل باستخدام ذاكرة إجمالية أقل؛ ويمكن أن يتجاوز معدل الاستخدام 80% |
| عملية التوسع | يتطلب إيقاف التشغيل وإدخال/إزالة وحدات الذاكرة يدويًّا؛ وقد يتطلب استبدال الأجهزة | يدعم التوصيل أثناء التشغيل والتخصيص الديناميكي؛ ويمكن إضافة موارد الذاكرة أو إزالتها أثناء التشغيل |
| السيناريوهات المناسبة | عمليات النشر على نطاق صغير التي تتطلب أداءً فائقًا وأحمال عمل مستقرة | مراكز البيانات الضخمة، وتدريب الذكاء الاصطناعي، والحوسبة السحابية، وغيرها من السيناريوهات التي تتطلب موارد مرنة |
كما يوضح الجدول، لا يزال الحل التقليدي DDR يتمتع بمزايا في الأداء الفائق وسهولة النشر، ولكن على حساب التكلفة المرتفعة وإدارة الموارد غير المرنة. في المقابل، يضحي حل CXL بقدر ضئيل من سرعة الوصول مقابل مزايا هائلة: سعة قابلة للتوسيع، وموارد قابلة للمشاركة، وكفاءة أفضل من حيث التكلفة. في عمليات مراكز البيانات الواقعية، غالبًا ما تكون هذه المقايضة جديرة بالاهتمام، لأن هدر الذاكرة الخاملة أكثر إيلامًا بكثير من اختلاف بسيط في السرعة.
حالات استخدام CXL
لا يُقصد من تقنية CXL أن تحل محل الذاكرة التقليدية؛ بل تهدف إلى معالجة حالات محددة تعاني منها الذاكرة التقليدية. وتتمثل المجالات الثلاثة التالية في المجالات التي تتمتع فيها تقنية CXL بأكثر عمليات النشر نضجًا وتقدم فيها قيمة واضحة.
الذكاء الاصطناعي وتدريب النماذج الضخمة
يتطلب تدريب نموذج لغوي ضخم يحتوي على مئات المليارات من المعلمات تحميل جميع معلمات النموذج وبيانات التدريب ونتائج الحسابات الوسيطة إلى الذاكرة في آن واحد. عندما يتجاوز حجم النموذج سعة ذاكرة خادم واحد، يسمح CXL لخادم واحد بربط عدة تيرابايت من ذاكرة CXL مباشرةً، مما يحفظ جميع البيانات داخل عقدة واحدة – مما يبسط نموذج البرمجة بشكل كبير ويحسن كفاءة التدريب. بالنسبة للفرق متوسطة الحجم التي تعمل على نماذج كبيرة، يوفر CXL مسارًا أكثر اقتصادية من شراء أجهزة الكمبيوتر المركزية باهظة الثمن.
تجميع ذاكرة مركز البيانات
في مراكز البيانات السحابية الكبيرة، غالبًا ما تحدث أحمال الذروة للمستأجرين والتطبيقات المختلفة في أوقات متباينة. ومن خلال نشر محولات CXL ومجمع ذاكرة CXL، يمكن لمركز البيانات تجميع كل الذاكرة الخاملة في مجمع مشترك وتخصيصها ديناميكيًا وفقًا لاحتياجات كل خادم في الوقت الفعلي. تشير تقديرات الصناعة إلى أن هذا النهج يمكن أن يرفع معدل استخدام الذاكرة من النسبة المعتادة التي تتراوح بين أربعين وخمسين بالمائة إلى ما يزيد عن ثمانين بالمائة – مما يعني أن نفس الاستثمار في الأجهزة يمكن أن يدعم ما يقرب من ضعف حجم أعباء العمل الحاسوبية.
الحوسبة السحابية وكثافة الأجهزة الافتراضية
يرغب مزودو الخدمات السحابية في تشغيل أكبر عدد ممكن من الأجهزة الافتراضية (VMs) على خادم مادي واحد لزيادة الإيرادات. ولكن يجب تخصيص مقدار ثابت من الذاكرة لكل آلة افتراضية، وحتى إذا لم يتم استخدام تلك الذاكرة كثيرًا في الواقع، فلا يمكن أن تشغلها آلات افتراضية أخرى. ونتيجة لذلك، غالبًا ما تنفد ذاكرة الخوادم قبل استنفاد موارد وحدة المعالجة المركزية (CPU) بوقت طويل، مما يحد من عدد الآلات الافتراضية التي يمكن إنشاؤها. تسمح مجموعة ذاكرة CXL لمنصة السحابة بمعاملة الذاكرة كمورد مرن للاكتتاب الزائد أو التعديل الديناميكي: عندما تستخدم آلة افتراضية ذاكرة أقل من المخصص لها، يمكن استرداد الفائض وتخصيصه لآلات افتراضية أخرى. تتيح هذه التقنية لمزودي الخدمات السحابية استضافة المزيد من المستأجرين على نفس الخوادم المادية، مما يقلل من تكاليف التشغيل.
وبالإضافة إلى حالات الاستخدام الثلاث الرئيسية هذه، تُستخدم تقنية CXL أيضًا في عمليات المحاكاة واسعة النطاق في مجال الحوسبة عالية الأداء، وتوسيع سعة قواعد البيانات التي تعمل في الذاكرة (مثل SAP HANA)، وتسريع محركات تحليل البيانات الضخمة في الوقت الفعلي (مثل Apache Spark). ما تشترك فيه هذه التطبيقات هو الطلب المرتفع جدًا على سعة الذاكرة جنبًا إلى جنب مع قدر معين من التسامح مع زمن الوصول – وهو بالضبط النطاق الذي يتفوق فيه CXL.
الوضع الحالي والتوقعات المستقبلية لـ CXL
انتقلت تقنية CXL من مرحلة المختبر إلى مرحلة النشر الفعلي. على صعيد الأجهزة، تدعم معالجات Intel Xeon Scalable من الجيل الرابع ومعالجات AMD EPYC من الجيل الرابع CXL 1.1 أو 2.0 بشكل أصلي. تقدم كبرى شركات بيع الخوادم مثل Dell وHPE وInspur وSupermicro خيارات ذاكرة CXL في خطوط منتجاتها المتطورة. تقوم Samsung و Micron الآن بإنتاج وحدات ذاكرة CXL بكميات كبيرة تتراوح سعتها بين 128 جيجابايت و 512 جيجابايت، وبعضها يدعم التوصيل السريع. على صعيد البرمجيات، يدعم نواة Linux CXL بشكل أصلي منذ الإصدار 5.18، وتعمل أنظمة تشغيل السحابة الرئيسية على تحسين تجميع ذاكرة CXL تدريجيًا.
وبالنظر إلى المستقبل، تتطور تقنية CXL في اتجاهين رئيسيين. الأول هو تحديثات البروتوكول. قدمت CXL 2.0 تجميع الذاكرة ودعم المحولات، والتي يتم تجربتها بالفعل. تزيد CXL 3.0 النطاق الترددي إلى 64 جيجابايت/ثانية وتضيف التبديل متعدد المستويات، والذي من المتوقع أن ينتشر بعد عام 2026. ومن المقرر أن تضاعف CXL 4.0، القائمة على PCIe 7.0، النطاق الترددي مرة أخرى تقريبًا. المسار الثاني هو تطور النشر. على المدى القصير، تعمل CXL كذاكرة “من المستوى الثاني” مكملة لذاكرة DDR المحلية. على المدى المتوسط، سيصبح تجميع الذاكرة معيارًا في مراكز البيانات الكبيرة، مما يجعل الذاكرة قابلة للتخصيص ديناميكيًا مثل الحوسبة والتخزين. على المدى الطويل، من المرجح أن يتعايش CXL و DDR: DDR لأحمال العمل الأساسية الحساسة للكمون، و CXL للذاكرة التوسعية القابلة للمشاركة ذات السعة الكبيرة.
ظهرت تقنية CXL كإجابة على سؤال طالما شغل بال صناعة الحوسبة: لماذا لا يمكن توسيع الذاكرة ومشاركتها بمرونة مثل التخزين؟ تعمل تقنية CXL، من خلال تصميم بروتوكولي أنيق، على بناء قدرات أساسية مثل تماسك ذاكرة التخزين المؤقت وتجميع الذاكرة فوق البنية التحتية الحالية لـ PCIe. من الأجهزة إلى البرامج، ومن توسيع جهاز واحد إلى مشاركة الموارد على نطاق مركز البيانات، تعمل CXL تدريجيًا على تغيير طريقة تفكيرنا بشأن الذاكرة. بالطبع، لا تزال هذه التقنية في مراحلها الأولى؛ وسيستغرق نضج البروتوكول واكتمال النظام البيئي وخفض التكلفة بعض الوقت. ولكن ما هو مؤكد هو أنه مع استمرار نمو نماذج الذكاء الاصطناعي واستمرار تجاوز أحجام البيانات للحدود المادية، ستصبح CXL – التي تحرر الذاكرة من الفتحات الثابتة – جزءًا أساسيًا بشكل متزايد من البنية التحتية في عالم الحوسبة عالية الأداء.





