世界最速のスーパーコンピューターが急速に進化

AI やクラウドコンピューティングに対応した最新世代のスーパーコンピューターの登場とともに、それらのマシンを評価する方法も進化

科学シミュレーション、可視化、データ分析、機械学習をはじめとする現代のコンピューティングワークロードによって、スーパーコンピューティングセンター、クラウドプロバイダー、および企業は、各自のコンピューティングアーキテクチャの見直しを迫られつつあります。

プロセッサやネットワーク、あるいはソフトウェアの最適化だけでは、研究者、エンジニア、およびデータサイエンティストらの最新のニーズに応えることはできません。むしろデータセンターが新たなコンピューティングの単位であり、組織はテクノロジのフルスタックに注目しなければなりません。

世界で最も強力なシステムの最新ランキングでは、最新世代のスーパーコンピューターにおいてこうしたフルスタックアプローチの勢いが続いていることが示されています。

NVIDIA のテクノロジは、今週の SC21 ハイパフォーマンスコンピューティングカンファレンスで発表された TOP500 リストにランクインしたシステムのうちの、70% を超える 355 のシステムを加速しており、新しいシステムだけを見るとその割合は全体の 90% を超えています。これは6 月に公表された TOP500 リストで掲載されているマシンのうちの 342 システム、すなわち 68% から増加しています。

また NVIDIA は、最もエネルギー効率の高いシステムのランキングである Green500 リストでも引き続き強力な存在感を示しており、6 月同様、リストにランクインした上位 25 のシステムのうちの 23 システムにNVIDIAのテクノロジが搭載されています。平均すると、NVIDIA GPU が搭載されたシステムは、リスト上の非 GPU システムよりも 3.5 倍も高い電力効率を実現しています。

新世代のクラウドネイティブシステムの登場を際立たせるように、Microsoft の GPU アクセラレーテッド Azure スーパーコンピューターがリストの第 10 位にランキングし、クラウドベースのシステムとして初めてトップ 10 入りを果たしました。

AI によってサイエンティフィックコンピューティングに大変革がもたらされています。近年、ハイパフォーマンスコンピューティング (HPC) と機械学習 (ML) を活用した研究論文の数が急増しており、2018 年に提出された ML + HPC の論文の数はおおよそ 600 本だったのが、2020 年には 5,000 本近くにまで増加しました。

また、現在進行中の HPC と AI のワークロードの融合は、HPL-AI や MLPerf HPC といった新たなベンチマークによっても明確に示されています。

HPL-AI は、ディープラーニングや多くの科学的および商業的ジョブの基礎である混合精度計算を使用しながらも、従来の HPC のベンチマークの標準的な測定基準である倍精度計算の完全な精度も提供する HPC と AI の融合ワークロードの新たなベンチマークです。

そして MLPerf HPC は、AI によってスーパーコンピューターでのシミュレーションを高速化させ、強化する方式のコンピューティングに対応するもので、天体物理学 (Cosmoflow)、気象 (Deepcam)、および分子動力学 (Opencatalyst) という、HPC センターの 3 つの主要なワークロードのパフォーマンスを測定するベンチマークです。

NVIDIA は、GPU による高速処理、スマートネットワーキング、GPU に最適化されたアプリケーション、および AI と HPC の融合をサポートするライブラリのフルスタックで取り組んでいます。このアプローチによってワークロードを高速化し、科学的なブレイクスルーを実現してきました。

NVIDIA がスーパーコンピューターをいかに高速化しているか、さらに詳しく見てみましょう。

アクセラレーテッドコンピューティング

GPU の並列処理機能と、 2,500 を超える GPU に最適化されたアプリケーションを組み合わせることで、ユーザーは、多くの場合は数週間から数時間へと HPC ジョブを高速化させることができます。

NVIDIAは CUDA-X ライブラリおよび GPU アクセラレーテッドアプリケーションを絶えず最適化しているので、同じ GPU アーキテクチャ上で数倍のパフォーマンス向上を目にすることは、ユーザーにとって珍しいことではありません。

その結果、私たちが「ゴールデンスイート」と呼んでいる、最も広く利用されている科学アプリケーションのパフォーマンスは過去 6 年間で 16 倍も向上しており、今なおさらなる進歩の途中にあります。

フルスタックのイノベーションによって、主要な HPC、AI、および ML アプリのパフォーマンスが 16 倍に向上**

また、ユーザーがより高いパフォーマンスを速やかに利用できるよう手助けするために、NVIDIAは NGC カタログのコンテナを通じて、最新バージョンの AI および HPC ソフトウェアを提供しています。ユーザーは単に、各自のスーパーコンピューター上、データセンター内、またはクラウド上で、アプリケーションを呼び出して実行するだけです。

HPC と AI の融合

HPC への AI の導入は、研究者たちが各自のシミュレーションを高速化しつつ、従来のシミュレーションアプローチで得られる精度を達成するのに役立ちます。

それゆえに、ますます多くの研究者が、自らの発見を迅速化するために AI を活用するようになっているのです。

その中には、スーパーコンピューティング分野で最も栄誉ある賞である、今年のゴードンベル賞のファイナリストのうちの 4 チームが含まれています。企業や機関は、HPC と AI を組み合わせた新たなモデルをサポートする、エクサスケールの AI コンピューターをこぞって構築しています。

それらの性能は、HPL-AI や MLPerf HPC といった比較的新しいベンチマークによって明確に示され、現在進行中の HPC と AI のワークロードの融合を際立たせています。

こうした傾向に拍車をかけるために、NVIDIA は先週、HPC 向けの幅広い先進的な新しいライブラリおよびソフトウェア開発キットを発表しました。

現代のデータサイエンスにおける主要なデータ構造であるグラフを、新しい Python パッケージの Deep Graph Library (DGL) により、ディープニューラルネットワークのフレームワークで扱えるようになりました。

また、NVIDIA Modulus は、物理法則を学んでそれに従うことのできる、物理情報に基づく機械学習モデルを構築してトレーニングします。

さらに NVIDIA は、以下の 3 つの新たなライブラリを発表しました。

ReOpt – 10 兆ドル規模の物流業界向けに業務効率を向上させます。
cuQuantum – 量子コンピューティング研究を加速させます。
cuNumeric – Python コミュニティの科学者、データサイエンティスト、機械学習および AI 研究者のために NumPy を加速させます。

それらすべてをまとめ上げるのが、仮想世界シミュレーション、および3D ワークフローに向けのコラボレーションプラットフォームの NVIDIA Omniverse です。

Omniverse は、倉庫、プラントや工場、物理システムおよび生体システム、5G エッジ、ロボット、自動運転車、さらにはアバターのデジタルツインをシミュレートするために使われています。

NVIDIA は先週、気候変動を予測することに特化した、Earth-2 と呼ばれるスーパーコンピューターを構築し、これを活用してOmniverse 上で地球のデジタルツインを作成することを発表しました。

クラウドネイティブなスーパーコンピューティング

データ分析、AI、シミュレーション、および可視化といった分野にわたって、スーパーコンピューターがより多くのワークロードを担うようになるにつれ、大規模で複雑なシステムの運用に必要な通信タスクの増加に対応するために CPU の負担が増大しています。

データプロセシングユニット (DPU) は、それらの処理の一部をオフロードすることでこのストレスを緩和します。

完全に統合された、オンチップ型のデータセンタープラットフォームである NVIDIA BlueField DPU は、データセンターのインフラストラクチャタスクをオフロード、管理し、ホストプロセッサに代わり実行することができ、スーパーコンピューターのより強力なセキュリティおよび効率的なオーケストレーションを可能にします。

NVIDIA Quantum InfiniBand プラットフォームと組み合わせることによって、このアーキテクチャは最適なベアメタルのパフォーマンスを実現するとともに、マルチノードのテナント分離をネイティブにサポートします。

NVIDIA の Quantum InfiniBand プラットフォームは、予測可能なベアメタルのパフォーマンス分離を提供します。

またゼロトラストアプローチのおかげで、これらの新システムはより安全でもあります。

BlueField DPU は、アプリケーションをインフラストラクチャから分離します。最新の BlueField ソフトウェアプラットフォームである NVIDIA DOCA 1.2 は、次世代の分散型ファイアウォールとラインレートのデータ暗号化の幅広い利用を可能にします。また NVIDIA Morpheus は、すでに侵入者がデータセンター内部にいると想定し、ディープラーニングによって強化されたデータサイエンスを利用して侵入者の活動をリアルタイムで検出します。

そして上述の動向のすべてが、新たなネットワーキングテクノロジによって加速されることになります。

同じく先週発表された NVIDIA Quantum-2 は、 400 Gbps の InfiniBand プラットフォームであり、Quantum-2 スイッチ、ConnectX-7 NIC、BlueField-3 DPU、および新たなネットワークアーキテクチャ用の新しいソフトウェアで構成されます。

NVIDIA Quantum-2 は、ベアメタルの高パフォーマンスとセキュアなマルチテナンシーというメリットをもたらし、次世代のスーパーコンピューターが、セキュアかつクラウドネイティブでより有効に活用できるようになります。

** ベンチマークアプリケーション：Amber、Chroma、GROMACS、MILC、NAMD、PyTorch、Quantum Espresso、Random Forest FP32、TensorFlow、VASP | GPU ノード：P100、V100、A100 のいずれかの GPU 4基とデュアルソケット CPU