CXLメモリソリューション:それは何ですか?

パソコンのメモリが足りなくなって困ったことはありますか?でも、USBメモリを差し込むように簡単にメモリを増設できないのがもどかしいですよね。 USBメモリ? CXL技術は、この問題を解決するために誕生しました。これはメモリの「外部拡張システム」のような役割を果たし、サーバーやワークステーションが専用のケーブルや拡張カードを介して大容量の外部メモリを柔軟に追加できるようにするだけでなく、複数のマシンで共通のメモリプールを共有することも可能にします。 CXL技術により、かつては高価なメインフレームでしか実現できなかった1TBのシステムメモリが、ハイパフォーマンスコンピューティングや人工知能の分野でますます一般的になりつつあります。.

CXLとは? CXLメモリソリューション:それは何ですか?

なぜCXLが登場したのか?

従来のサーバーメモリは、個別の収納ロッカーを備えた大きなマンションのようなものだと考えることができます。各部屋(各サーバー)には独自の収納スペースがありますが、そのスペースの大きさは入居時に決まっており、たとえ隣人のロッカーが空いていても、それを借りることはできません。 人工知能、クラウドコンピューティング、ビッグデータの普及に伴い、このモデルには3つの深刻な問題が生じ始めています。.

物理スロットが足りなくなると、メモリを増設することはできません。. 各サーバーのマザーボードに搭載できるメモリスロットの数は限られており、通常は8、12、または16個です。たとえすべてのスロットに市場で入手可能な最大容量のメモリモジュールを装着したとしても、総容量には上限があります。 アプリケーションに必要なメモリ容量がその上限を超える場合、既存のマシンにメモリを追加するだけでは不十分であり、より高価で高性能なサーバーを購入する以外に解決策はありません。.

メモリリソースは共有できないため、大きな無駄が生じます。. 大規模なデータセンターでは、サーバーごとに負荷のピークが異なることがよくあります。しかし、従来のアーキテクチャでは、こうした遊休メモリリソースを、それを必要とするサーバーが「借りる」ことはできません。業界の統計によると、データセンターにおけるメモリ使用率は50%を下回る場合が多く、つまりハードウェア投資のほぼ半分が遊休状態にあることになります。.

急激な需要増に対応するため、企業は過剰投資を余儀なくされている。. プロジェクトで時折、通常の2倍のメモリ容量が必要になる場合、従来の解決策は、ピーク時の需要に対応できるハードウェアを購入することでした。しかし、その費用は、ほとんどの場合、使われないまま放置される容量に費やされてしまいます。また、いったんそれらのハードウェアモジュールが導入されると、異なるプロジェクト間で柔軟に再割り当てしたり、ビジネスの成長に合わせて容易に拡張したりすることはできません。.

それは、これら3つの問題を一度に解決するためだった―― 限られた物理的容量、リソースの共有が困難であること、および投資効率の低さ – CXL技術はエンジニアによって設計されました。この技術は、メモリと演算ユニットの接続方法を根本的に変革し、メモリをオンデマンドで接続し、動的に割り当て可能なリソースへと変えます。.

CXLとは何か、その仕組みは?

CXLは、標準的なPCIe物理インターフェースに基づくオープンな通信プロトコルです。その正式名称は Compute Express Link, 、これはCPUと外部メモリデバイス間の高速かつ一貫性のある低遅延通信を可能にする「言語ルール」のセットと考えることができます。 CXLのユニークな点は、CPUが外部メモリを、アクセスするために迂回を要する周辺機器としてではなく、あたかも自身の体の一部であるかのように扱うことを可能にする点にあります。.

キャッシュコヒーレンス

次のような状況を想像してみてください。あなたと同僚が、同じオンライン文書を編集しているとします。もし、それぞれがローカルコピーを保存してから変更を加えると、統合する際に競合が発生してしまいます。どちらの変更を優先すべきでしょうか?コンピュータのメモリも、同じ問題に直面しています。 CPUの内部には、「キャッシュ」と呼ばれる非常に高速で小さな記憶領域があり、メインメモリから最近使用されたデータのコピーを保持しています。CPUがメモリにアクセスする際、まずキャッシュから読み込みを行います。これははるかに高速です。 しかし、ローカルのDDRメモリと外部のCXLメモリの両方に同じデータのコピーが保持されており、一方のコピーが変更された場合、もう一方のコピーもそれに応じて更新されなければなりません。 そうしないと、CPUが誤ったデータを読み取ってしまう可能性があります。この問題は「キャッシュコヒーレンス」と呼ばれます。CXLにはこれを処理するための専用のサブプロトコルが含まれており、すべてのコピーの一貫性を保つために、CPUと外部メモリの間で絶えず「通信」を行っています。.

メモリプーリングと柔軟な割り当て

従来のアプローチでは、各サーバーは自身のスロットにあるメモリしか使用できません。. CXLは「プーリング」という概念を導入しました“: 複数のCXLメモリデバイスをCXLスイッチに接続して、単一の大容量メモリプールを形成し、複数のサーバーが必要に応じてこのプールからメモリを「引き出す」ようにすることができます。これは、オフィスビルで各室にある個別のウォータークーラーを、廊下にある中央給水ステーションに置き換え、そこで誰もが必要な時に水を汲むようなものです。 給水ステーションの総容量は、10台の個別ウォータークーラーの合計容量よりも小さくても、ピーク時の使用時間が重ならないため、全員のニーズを満たすことができます。 同様に、CXLメモリプールにより、データセンター管理者は各サーバーのリアルタイムの負荷に基づいてメモリを動的に割り当てることができます。つまり、負荷が高い時にはメモリを増やし、アイドル時にはメモリを回収することで、より少ないハードウェア総量でより多くのコンピューティングタスクをサポートすることが可能になります。.

CXLメモリプールとスイッチ CXLメモリソリューション:それは何ですか?

CXLテクノロジーには何が含まれますか?

CXLは、物理的なハードウェアからソフトウェアの設定に至るまで、すべてを網羅した包括的なメモリソリューションです。 このシステムを高速道路に例えることができます。道路そのもの(物理的な接続)はあくまで土台に過ぎず、車両が秩序正しく走行するためには交通ルール(通信プロトコル)が必要であり、車両の行き先や使用する車線を指示するためには交通管理システム(ソフトウェア構成)が必要です。 これらの層のいずれかが欠けても、高速道路は真の意味で機能することはできません。.

ハードウェア層:目に見えるコンポーネント

CXL技術の物理的な構成要素には、メモリ拡張のためのインフラストラクチャを形成するさまざまな種類のデバイスが含まれます。最も一般的なハードウェアはCXLメモリ拡張カードで、グラフィックカードに似た外観をしており、サーバーのマザーボードにある既存のPCIeスロットに直接差し込むことができます。このカードには、メモリチップが実装されているか、メモリモジュール用のスロットが備わっています。 カードを挿入すると、システムは追加されたメモリ容量を認識します。もう一つのハードウェア形態として、CXLメモリモジュールがあります。これはコンパクトなSSDのように小型で、サーバーの専用ドライブベイに設置できるため、高密度な導入に適しています。.

CXLハードウェアの種類CXLメモリソリューション:それは何ですか?

複数のサーバーやメモリデバイスを接続する必要がある場合、CXLスイッチが活用されます。これはネットワークスイッチに似ていますが、ネットワークパケットを切り替えるのではなく、メモリアクセス要求を切り替えます。 CXLスイッチを介して、管理者は複数のCXLメモリカードを相互に接続し、統合された大容量メモリプールを形成することで、複数のサーバーがそのプールのリソースを同時に共有できるようにします。 長距離の場合、専用のCXLケーブルを使用することで、数メートルから数十メートルの距離でも高速伝送を維持できるため、メモリデバイスをサーバーとは別のラックに配置することが可能になります。.

プロトコル層:通信のための言語規則

CXLプロトコル層のCXLメモリソリューション:それは一体何なのか?

ハードウェアが骨格だとすれば、プロトコルはすべてを機能させる魂のようなものです。CXLプロトコルには3つの並列サブプロトコルが含まれており、それぞれが異なる役割を担っています。これらは互いに干渉することなく、同時に動作することができます。.

  • 最初のサブプロトコルは CXL.io, その役割は、デバイスの検出と初期化です。サーバーにCXLメモリカードを挿入すると、, CXL.io このプロセスは、CPUにデバイスを認識させ、その基本情報(容量や対応モードなど)を読み取り、デバイス用にアドレス空間を割り当てる役割を担っています。このプロセスは、グラフィックカードやネットワークカードを接続する手順と非常に似ています。.
  • 2つ目のサブプロトコルはCXL.cacheと呼ばれます, これは、CXLの中核機能の一つです。CXL.cacheは、CPUのキャッシュと外部メモリ間のデータの一貫性を維持します。前述の通り、CPUがデータを変更すると、CXL.cacheは外部メモリ内の対応するコピーも更新されるようにし、その逆も同様です。.
  • 3番目のサブプロトコルはCXL.memと呼ばれます, これは、実際のデータの読み書きを処理するものです。CPUがCXLメモリからデータを読み出す必要がある場合、CXL.memがリクエストを送信し、データを返します。また、CPUがCXLメモリにデータを書き込む必要がある場合も、CXL.memが同様に転送を行います。.

ソフトウェア層:すべてを円滑に機能させるための設定と管理

ソフトウェアの設定を行うことで、オペレーティングシステムやアプリケーションがこの新しいメモリを実際に利用できるようになります。BIOSでは、管理者がCXL機能を有効にし、リソースを割り当てる必要があります。 オペレーティングシステムレベルでは、Linuxを例にとると、CXLメモリは独立したNUMAノードとして認識され、管理者はコマンドを使用して、プログラムがローカルメモリを優先するかCXLメモリを優先するかを指定できます。 また、最新のオペレーティングシステムはメモリ階層化もサポートしており、最も頻繁にアクセスされるデータは高速なローカルDDRに保持し、アクセス頻度の低いデータはCXLメモリへ自動的に移行します。オペレーティングシステムがCXLメモリを通常のメモリと同様に管理するため、大多数のアプリケーションでは、CXLメモリを使用するためにコードの変更は一切必要ありません。.

oscoo 2b バナー 1400x475 1 CXLメモリソリューション:iTとは?

CXLと従来のメモリソリューションの比較

側面従来のDDRソリューションCXLソリューション
容量の上限マザーボードのメモリスロット数およびモジュールの最大容量によって制限されます。上限に達すると、それ以上拡張することはできません。マザーボードを交換することなく、CXL拡張カードやスイッチを介してメモリを増設し続けることができます
リソースの柔軟性各サーバーのメモリ容量は固定されており、サーバー間で再割り当てすることはできませんメモリプールをサポートしており、複数のサーバーが必要に応じて共通のメモリプールを共有できます
費用対効果ピーク時の需要に対応するために大量のメモリを購入しているが、日々の利用率は50%を下回る場合が多いより少ない総メモリ容量で同等のワークロードに対応可能。利用率は80%を超える場合があります。
拡張操作システムのシャットダウンやメモリモジュールの物理的な着脱が必要となります。また、ハードウェアの交換が必要になる場合があります。ホットプラグおよび動的割り当てに対応しており、メモリリソースをオンラインで追加または削除できます
適したシナリオ極めて高いパフォーマンスが求められ、かつワークロードが安定している小規模な導入環境大規模データセンター、AIトレーニング、クラウドコンピューティング、および弾力的なリソースを必要とするその他のシナリオ

表が示すように、従来のDDRソリューションは、極限のパフォーマンスとシンプルな導入という点で依然として優位性を持っていますが、その代償として、コストが高く、リソース管理が柔軟性に欠けるという課題があります。対照的に、CXLソリューションは、アクセス速度をわずかに犠牲にする代わりに、容量の拡張性、リソースの共有、そして優れたコスト効率という大きなメリットをもたらします。 実際のデータセンター運用においては、わずかな速度の差よりも、アイドル状態のメモリが無駄になることの方がはるかに痛手となるため、このトレードオフは多くの場合、非常に価値のあるものとなります。.

CXLのユースケース

CXLは、従来のメモリに取って代わることを目的としたものではありません。従来のメモリでは対応が難しい特定のシナリオを解決することを目的としています。以下の3つの分野は、CXLの導入が最も成熟しており、最も明確な価値を提供している領域です。.

人工知能と大規模モデルの学習

数百億のパラメータを持つ大規模言語モデルを学習させるには、モデルパラメータ全体、学習データ、および中間計算結果を同時にメモリに読み込む必要があります。 モデルサイズが単一サーバーのメモリ容量を超える場合、CXLを利用すれば、1台のサーバーに数テラバイトのCXLメモリを直接接続し、すべてのデータを単一ノード内に保持することが可能になります。これにより、プログラミングモデルが大幅に簡素化され、トレーニング効率が向上します。大規模モデルに取り組む中規模チームにとって、CXLは高価なメインフレームを購入するよりも経済的な選択肢となります。.

データセンターのメモリプーリング

大規模なクラウドデータセンターでは、テナントやアプリケーションごとにピーク負荷が発生するタイミングが異なることがよくあります。CXLスイッチとCXLメモリプールを導入することで、データセンターはすべてのアイドル状態のメモリを共有プールに集約し、各サーバーのリアルタイムのニーズに応じて動的に割り当てることができます。 業界の推計によると、このアプローチにより、メモリ使用率は従来の40~50%から80%以上に引き上げられる可能性があります。つまり、同じハードウェア投資で、ほぼ2倍のコンピューティングワークロードをサポートできるようになるということです。.

クラウドコンピューティングと仮想マシンの密度

クラウドサービスプロバイダーは、収益を増やすために、1台の物理サーバー上でできるだけ多くの仮想マシン(VM)を実行したいと考えています。 しかし、各VMには固定量のメモリが割り当てられる必要があり、たとえそのメモリが実際にはあまり使用されていなくても、他のVMがそれを利用することはできません。その結果、サーバーはCPUリソースが枯渇するずっと前にメモリ不足に陥ることが多く、作成できるVMの数が制限されてしまいます。 CXLメモリプールを利用することで、クラウドプラットフォームはメモリをオーバーサブスクリプションや動的な調整のための弾力的なリソースとして扱うことができます。つまり、VMが割り当てられたメモリよりも少ないメモリしか使用していない場合、余剰分を回収して他のVMに割り当てることが可能です。この技術により、クラウドプロバイダーは同じ物理サーバー上でより多くのテナントをホストできるようになり、運用コストを削減できます。.

これら3つの主なユースケース以外にも、CXLは高性能コンピューティングにおける大規模シミュレーション、インメモリデータベース(SAP HANAなど)の容量拡張、およびリアルタイムビッグデータ分析エンジン(Apache Sparkなど)の高速化にも活用されています。 これらのアプリケーションに共通するのは、メモリ容量に対する非常に高い要求と、ある程度のレイテンシ許容度を兼ね備えている点であり、まさにこれがCXLが真価を発揮する領域です。.

CXLの現状と今後の見通し

CXLは実験段階から実運用へと移行しました。 ハードウェア面では、Intelの第4世代Xeon ScalableおよびAMDの第4世代EPYCプロセッサが、CXL 1.1または2.0をネイティブでサポートしている。Dell、HPE、Inspur、Supermicroといった主要なサーバーベンダーは、ハイエンド製品ラインにおいてCXLメモリオプションを提供している。 サムスンとマイクロンは現在、128GBから512GBまでのCXLメモリモジュールを量産しており、その一部はホットプラグに対応しています。ソフトウェア面では、Linuxカーネルはバージョン5.18以降、CXLをネイティブでサポートしており、主要なクラウドOSもCXLメモリプーリング機能を徐々に改善しています。.

今後、CXLは主に2つの方向で進化していく見込みです。1つ目はプロトコルのアップグレードです。 CXL 2.0ではメモリプーリングとスイッチのサポートが導入され、すでに試験運用が行われています。CXL 3.0では帯域幅が64 GB/sに拡大され、マルチレベルスイッチングが追加され、2026年以降に普及が見込まれています。PCIe 7.0をベースとするCXL 4.0では、帯域幅がさらに約2倍になる予定です。 2つ目の軸は、導入形態の進化です。短期的には、CXLはローカルDDRを補完する「第2層」のメモリとして機能します。中期的には、大規模データセンターにおいてメモリプーリングが標準となり、メモリがコンピューティングやストレージと同様に動的に割り当て可能になるでしょう。 長期的には、CXLとDDRが共存する可能性が高い。レイテンシに敏感なコアワークロードにはDDRを、大容量で共有可能な拡張メモリにはCXLが用いられることになるだろう。.

CXL技術は、コンピューティング業界が長年抱えてきた疑問、「なぜメモリはストレージのように柔軟に拡張・共有できないのか」に対する答えとして登場しました。CXL技術は、洗練されたプロトコル設計を通じて、既存のPCIeインフラストラクチャの上に、キャッシュコヒーレンスやメモリプーリングといった重要な機能を構築します。 ハードウェアからソフトウェアへ、単一マシンの拡張からデータセンター全体でのリソース共有へと、CXLはメモリに対する私たちの考え方を徐々に変えつつあります。もちろん、この技術はまだ初期段階にあり、プロトコルの成熟、エコシステムの整備、コスト削減にはすべて時間がかかります。 しかし、AIモデルが拡大し続け、データサイズが物理的な限界を次々と突破していく中で、メモリを固定スロットから解放するCXLが、ハイパフォーマンス・コンピューティングの世界において、ますます不可欠なインフラの一部となることは確実です。.

トップに戻る

お問い合わせ

下記のフォームにご記入ください。

コンタクトフォーム製品