NVIDIA BlueField が、DPU 性能の世界新記録を樹立

投稿者: Ami Badani

サーバーとストレージ間の I/O性能が 4,100 万 IOPS を超え、従来の記録を 4 倍以上更新したデータ プロセシング ユニット

データ センターでは極めて高速なストレージ アクセスが必要ですが、NVIDIA BlueField-2 より高速な DPU は存在しません。

NVIDIA が先頃行ったテストでは、2 つの BlueField-2 データ プロセシング ユニットで、4,150 万 IOPS (Input/Output per Second) という記録を達成しました。この記録は、従来の DPU が打ち立てた記録を 4 倍以上更新しています。

BlueField-2 DPU は、標準的なネットワーク プロトコルとオープンソースのソフトウェアを使って、新記録となる性能を実現しました。ストレージ メディアにアクセスするための一般的な手法である NVMe over Fabrics (NVMe-oF) を使用し、主要なインターネット プロトコルの 1 つである TCP ネットワーク上にて 4KB IOPS で 500 万を上回る記録を達成したほか、512B IOPS では従来の記録の 700 万から 2,000 万を大幅に超える記録更新を果たしました。

AI、ビッグデータおよびハイパフォーマンス コンピューティングを加速するために、BlueField は、人気の高い ネットワーク転送オプションである RoCE を使用することで、より高いストレージ性能を実現します。

テストにおいて、BlueField は、多様なタイプのストレージ ソフトウェア ライブラリと様々なワークロードを使用して現実世界のストレージ構成をシミュレーションした環境で、イニシエーターとしても、ターゲットとしても性能を加速しました。BlueField は、多くの HPC および AI のアプリケーションに適しているネットワーク アーキテクチャである InfiniBand 上での高速ストレージ接続にも対応しています。

テスト方法

BlueField が樹立した、4,150 万 IOPS という記録は、これまで独自のストレージを使用して達成した1,000 万 IOPS の世界記録を 4 倍以上上回るものです。この性能は、高速サーバーである Hewlett Packard Enterprise Proliant DL380 Gen 10 Plus を 2 台接続することで可能になり、サーバー1 台目はアプリケーション サーバー (ストレージ イニシエーター) として、2台目はストレージ システム (ストレージ ターゲット) として使用しました。

それぞれのサーバーは、ベースクロックが 2.3GHz のIntel “Ice Lake” Xeon Platinum 8380 CPU が 2 基搭載され、サーバー 1 台当たり 160 ハイパースレッド コアと、さらに 512GB の DRAM、120MB の L3 キャッシュ (ソケット当たり 60MB)、およびPCIe Gen4 バスを搭載していました。

ネットワークと NVMe-oF を加速するために、各サーバーには、2 枚の NVIDIA BlueField-2 P-series DPU カードと、それぞれ2つの 100Gb の Ethernet ネットワークポートを搭載し、NVIDIA LinkX 100GbE Direct-Attach Copper (DAC) パッシブ ケーブルによってバックツーバック接続することで、イニシエーターとターゲット間で 4 つのネットワーク ポートによる 400Gb/s の帯域での接続としました。両方のサーバーには、Red Hat Enterprise Linux (RHEL) バージョン 8.3 を実装しました。

ストレージ システム ソフトウェアについては、SPDK および Linux の標準的なアップストリーム用カーネル ターゲットの両方がテスト対象となり、Linux のカーネルではデフォルトのカーネル 4.18 と最新カーネルの 1 つであるであるバージョン 5.15がテストで使用されました。その際、SPDK、標準的なカーネル ストレージ イニシエーター、および SPDK 用 FIO プラグインの 3 つの異なるイニシエーターでベンチマークを行いました。ワークロードの生成と測定には、FIO と SPDK で使用しました。I/O サイズは、それぞれが中型および小型ストレージの一般的な I/O サイズである、4KB と 512B で行われました。

NVMe-oF ストレージ プロトコルは、トランスポート層において、TCP と RoCE の両方を使ってテストされました。それぞれの構成は、完全双方向のネットワークにおいて、100 パーセント読み取り、100 パーセント書き込み、および読み取り/書き込み 50/50 のワークロードを使ってテストされました。

このテストでは、BlueField DPU の以下のような性能特性も明らかになりました。

  • 規模の小さい 512B の I/O サイズでは、IOPS は向上しましたが、スループットはラインレートより低くなり、4KB の I/O サイズでは、スループットが高くなり、IOPS は低下しました。
  • 100 パーセント読み取りおよび 100 パーセント書き込みのワークロードでは、IOPS とスループットはほぼ同じでしたが、読み取り/書き込み 50/50 のワークロードでは、双方向のネットワーク通信が同時に行われることにより、より高い性能が得られました。
  • SPDK を使用すると、カーネル空間用のソフトウェアに比べて高い性能が得られましたが、その代償として、サーバー CPU の利用率が高くなりました。これは事前に予測されていた振る舞いで、SPDK がユーザー スペースでポーリングを継続的に行うことがその理由となっています。
  • 最新の Linux 5.15 カーネルでは、Linux コミュニティによってストレージの改善が継続的に行われた結果として、4.18 より性能が高くなりました。

記録的な DPU ストレージ性能により、セキュリティを備えたストレージ性能を実現

今日のストレージの環境は、クラウドおよびエンタープライズの多くで、Ethernet または InfiniBand でアクセスする、高速で、分散化およびネットワーク化された、フラッシュ ストレージを必要としています。より高速のサーバー、GPU、ネットワークおよびストレージ メディアはいずれも、サーバーの CPU につねに負担をかけるため、最適な方法はストレージ対応 DPU の導入ということになります。

BlueField-2 DPU が示した、驚異的なストレージ性能により、アプリケーション サーバーおよびストレージ アプライアンス向けデータセンター全体の性能および効率の向上が可能になります。

BlueField は、高速ストレージ アクセスだけでなく、Ethernet ストレージ トラフィックおよびストレージ メディア自体の、ハードウェア アクセラレーションによる暗号化および複号化にも対応しており、データの盗難またはデータ流出からの保護を可能にします。

BlueField は、最大100Gb/sで IPSecによる通信データの暗号化を、また最大200Gb/sで256ビットAEX-XTSによる保存データの暗号化をオフロード出来るため、、 ストレージ ネットワークにトラップが仕掛けられた場合でも、あるいは物理的なストレージ ドライブの盗難、売却または不適切な廃棄があった場合でも、データ盗難のリスクを軽減することができます。

お客様および主要なセキュリティ ソフトウェア ベンダーは、先頃アップデートされた、BlueField の NVIDIA DOCA フレームワークを使い、DPU 上で、分散ファイアウォールやマイクロ セグメンテーションによるセキュリティ グループといったサイバーセキュリティ アプリケーションを実行し、コンピュート サーバーのアプリケーションおよびネットワーク セキュリティをさらに改善しており、これらのサーバーに接続されたストレージでの不適切なアクセスまたはデータ改変のリスクを軽減させています。

NVIDIA BlueField-2 DPU テストの詳細な結果

TCP で NVMe-oF を使った NVIDIA BlueField-2 DPU のテスト。それぞれのテスト結果は、2 つのNVIDIA BlueField-2 DPU の性能を合計したものです。

NVMe-oF RoCEを使用したNVIDIA BlueField-2 DPUのテスト。各テスト結果は、2つのBlueField-2 DPUの性能を合計したものです。

NVIDIA ネットワーキング アクセラレーションについて、もっと学ぶ

以下のリンクから、NVIDIA DPU、DOCA、RoCE について、ならびに DPU と DOCA によってアクセラレーテッド ネットワーキングとゼロトラスト セキュリティを実現する方法について、より詳しく学ぶことができます。