NVIDIA vComputeServer と NGC コンテナにより、AI、ディープラーニングおよびデータ サイエンスでの GPU 仮想化が可能に

投稿者: Anne Hecht

VMware、Cisco、Dell、Red Hat といった業界のリーダーが vComputeServer に対応し、GPU サーバーの展開および管理を簡略化

NVIDIA は仮想クライアント コンピューティングを変容させてきた、仮想 GPU (vGPU) テクノロジが、AI、ディープラーニングおよびデータ サイエンスでのサーバー仮想化に対応すると発表しました。これまでは処理を CPU のみに制限されていた AI ワークロードを、新しい vComputeServer ソフトウェアと NVIDIA NGC が実装された VMware vSphere といった仮想環境に簡単に展開できるようになるのです。NVIDIA の VMware との連携により、このアーキテクチャを導入する組織は、GPU を活用して自社のデータセンターと VMware Cloud on AWS との間で、AI ワークロードをシームレスに移行できるようになります。

vComputeServer により、データセンターの管理者は仮想環境の GPU サーバーで AI ワークロードを実行して、セキュリティ、利用性および管理性を向上させることができます。IT 管理者は vCenter と vMotion を含む VMware vSphere のようなハイパーバイザー型仮想化ツールを使用して、NVIDIA GPU で実行されている AI アプリケーションを含む、すべてのデータセンター アプリケーションを管理できるようになります。

多くの企業がデータセンターに GPU を導入していますが、AI のトレーニングや推論といった GPU アクセラレーション ワークロードは、ベアメタルで実行されています。これらの GPU サーバーは、個別に管理する必要があるため、隔離されていることがよくあります。そのために、利用性と柔軟性が制限されています。

vComputeServer により、IT 管理者は GPU によって加速された仮想サーバーの管理をより簡潔に行えるようになり、さらに既存のワークフローを維持することで、全体的な運用費用を削減することができます。CPU のみのサーバーに比べて、4 つの NVIDIA V100 GPU を搭載した vComputeServer は、ディープラーニングを 50 倍速くすることができ、ベアメタルに近い性能を発揮します。

この発表は、これまで対応してきたRed Hat と Nutanix を含む KVM ベースのハイパーバイザーに加えて、VMware vSphere への対応も行うというもので、これにより、管理者は GPU クラスタ向けにも、他のデータセンターと同じ管理ツールを使えるようになります。

仮想 GPU により、あらゆるワークロードでのパフォーマンスを飛躍的に向上

vGPU ポートフォリオに NVIDIA vComputeServer を加えることにより、NVIDIA はデータ アナリティクス、AI、ディープラーニング、HPC および他のサーバー ワークロードにも対応することになります。vGPU のポートフォリオには、ナレッジワーカー向けの NVIDIA GRID 仮想 PC と GRID 仮想 アプリ、およびプロフェッショナル グラフィックスのための Quadro 仮想データセンター ワークステーションといった、仮想デスクトップ機能も含まれています。

NVIDIA vComputeServer には、複数の仮想マシンを 1 つの GPU で作動させる GPU シェアリング、1 つまたは複数の GPU で 1 台の仮想マシンを作動させる GPU アグリゲーションといった機能を提供します。これにより、利用性と費用対効果を最大化させることができます。

vComputeServer の特徴は、以下の通りです。

  • GPU 性能: CPU のみの場合と比べて DL のトレーニングが最大で 50 倍高速化され、GPU ベアメタルで実行した場合と同等の性能が得られます。
  • 先進の演算性能: エラーコレクティングコード(ECC)とダイナミック ページ リタイアメントによって、データ破損への予防ができ、ワークロードの精度が上がります。
  • ライブ マイグレーション: GPU を活用している仮想マシンを、最小の中断時間またはダウンタイムで移行させることができます。
  • セキュリティの向上: 企業はサーバー仮想化によるセキュリティ上の便益を GPU クラスタに拡大させることができます。
  • マルチテナントでの隔離: ワークロードを隔離することで、単一のインフラストラクチャで複数のユーザーに安全に対応することができます。
  • マネージメントとモニタリング: 管理者は、同一のハイパーバイザー型仮想化ツールで GPU サーバーを管理し、ホスト、VM およびアプリケーション レベルで管理を可視化することができます。
  • 多様な GPU に対応: vComputeServer は NVIDIA T4 または V100 GPU とともに、 Quadro RTX 8000 および 6000 GPU、ならびに前世代の Pascal アーキテクチャの P40, P100 および P6 GPU に対応しています。

NVIDIA NGC が VMware vSphere にも対応

ディープラーニング、機械学習および HPC のための GPU 最適化ソフトウェアのハブである、NVIDIA NGC には、CUDA を活用してデータ サイエンスを加速するためのソフトウェアである RAPIDS など、AI をコンセプトから実用へと加速させるための 150 以上のコンテナ、トレーニング済みのモデル、トレーニング スクリプトおよびワークフローが備わっています。

RAPIDS には、データ ローディング、ETL、モデルのトレーニングおよび推論を含むデータ サイエンスのパイプライン全体を加速するための、多様なオープンソース ライブラリが備わっており、これによって、データ サイエンティストは作業をより迅速に完了させ、作成可能なモデルのタイプを大幅に増やすことができます。

すべての NGC ソフトウェアは、vComputeServer が実装された VMware vSphere のような仮想環境で展開することができます。

IT 管理者は、VMware vSphere のようなハイパーバイザー型仮想化ツールを使って、NVIDIA GPU で実行されている VM 内のすべての NGC コンテナを管理することができます。

また、NVIDIA では検証済みの NGC-Ready サーバーによって、IT 部門が GPU サーバーの実用化をより迅速に行えるように支援しています。さらに、エンタープライズグレードのサポートにより、ユーザーおよび管理者は、NVIDIA の NGC ソフトウェアのエキスパートに直接問い合わせを行い、リスクを最小化し、生産性を向上させることができます。

業界での対応

Dell、Cisco、VMware などの業界大手のパートナー企業が、NVIDIA vComputeServer への対応を表明しています。

発売予定

NVIDIA vComputeServer は、8 月に発売が開始されます。
詳しくは、NVIDIA vComputeServer のサイトをご覧ください。