ハイパフォーマンス コンピューティング (HPC) コミュニティが次の飛躍的な機能向上のために Arm に注目し、NVIDIA がその取り組みを加速
システムの多様化を目指して、柔軟でエネルギー効率の高い選択肢を模索している世界中のスーパーコンピューティング センターが、エクサスケールの独自スパコンの実現に向け Arm に注目し始めています。
Arm は世界で最も一般的な CPU アーキテクチャですが、データセンター市場でのシェアは、パートナー、ソフトウェアおよび開発ツールのエコシステムにより x86 アーキテクチャが 97% 以上を占めています。
NVIDIA では、x86 や IBM の POWERなど、伝統的にすべての CPU アーキテクチャを長年サポートしてきました。それには、Arm アーキテクチャも含まれます。NVIDIA は Arm を買収して、パートナーやお客様にとってユニークな組み合わせを生み出すことで、大幅に拡大、加速したいと考えています。
最近 GTC で登壇した、Arm の IP グループ担当社長であるルネ ハース (Rene Haas) 氏は、次のように述べています。「Arm のエネルギー効率の高い柔軟なアーキテクチャは、ハイパフォーマンス コンピューティング、クラウド、エッジ アプリケーションなど、あらゆる種類のワークロードに最適です。Arm アプリケーションを加速するためのNVIDIA の取り組みは、イノベーションの促進やエコシステムの強化につながり、お客様やエンド ユーザーにさらなる選択肢をもたらすでしょう。」
エクサスケールのスパコン開発への Arm の利用
Arm のオープン アーキテクチャは、組織がワークロードに最適なCPU を設計する柔軟性を提供します。そこで、世界中のスーパーコンピューティング センターがこの強力な選択肢の利用を進めています。
「欧州のエクサスケール スーパーコンピューティングを強化するために European Processor Initiative で考案されたArm ベースの高性能CPU のプロバイダーとして、SiPearl は Arm エコシステムの発展に注力しています」と、SiPearl の創業者/CEO であるフィリップ ノットン (Philippe Notton) 氏は述べ、次のように付け加えます。
「GPU アクセラレーテッド ノードに当社の CPU を実装するには、安定した開発環境、ドメイン固有のライブラリ、開発キット、そして HPC アプリケーションのチューニングが不可欠です。このすべての領域における NVIDIA の投資と専門知識が、エコシステムや市場の持続的な成長を後押ししています。」
韓国の国立研究機関である ETRI では、将来の独自スーパーコンピューター用に Arm ベースの CPU を開発しています。HPC や AI アプリケーションに対応できるよう、倍精度と混合精度、両方の演算をサポートすることを目指しています。
また、インドの C-DAC では、同社の科学研究や AI イニシアチブに利用できるエクサスケールのシステムの原動力として、Arm ベースの CPU を構築中です。
NVIDIA が Arm に新たなツールを提供
NVIDIA HPC ソフトウェア開発キット (SDK) はアプリケーション開発やArm アーキテクチャへの移植を簡素化するための包括的なコンパイラ、ライブラリ、ツールのスイートであり、数ある Arm ベースの HPC の取り組みに活用されています。この SDK は、アクセラレーテッド Arm HPC エコシステムの基盤となっています。
このソフトウェアの次期バージョン (7 月リリース予定の HPC SDK 21.7) では、コンパイラがパフォーマンスのチューニングに利用できる機能として Arm 組み込み関数がより多く提供されるほか、Arm CPU 専用に最適化されたカスタムの数学関数も提供されます。
さらに NVIDIA は、Arm の Neoverse プラットフォームの SVE (Scalable Vector Extensions) をサポートする予定です。SVE は、世界最速のスーパーコンピューターのランキング「TOP500」で 1 位を獲得した「富岳」の原動力である、富士通の A64FX で初めて採用されています。
アクセラレーテッド Arm キットを 7 月にリリース
それ以外にも、アクセラレーテッド Arm システムでの HPC や AI アプリケーションの開発、評価、ベンチマークを、NVIDIA Arm HPC 開発者キットによって容易にしています。これは、NVIDIA と GIGABYTE が提供するプラットフォームで、Ampere Altra Arm ベースの CPU、NVIDIA A100 Tensor コア GPU、およびネットワークを高速化するNVIDIA BlueField-2 DPU を搭載したサーバー上に読み込まれるソフトウェアとして提供されます。
ロスアラモス国立研究所をはじめとする 70 を超える主要機関の開発者から、すでに 7 月リリースの同キットへのアーリー アクセスのお申込みをいただいています。
ロスアラモス国立研究所の次世代システム担当チーフ アーキテクトであるスティーブ プール (Steve Poole) 氏は、次のように述べています。「当所では、NVIDIA HPC SDK を利用して、Arm アーキテクチャ向けのいくつかの AI/ML ワークフローと共に、主要アプリケーションを構築しています。NVIDIA Arm 開発者キットによって、NVIDIA GPU と Arm CPU への当所コードの移行が促進されることを期待しています。」
アプリで研究者の Arm 採用を促進
NVIDIA は、分子動力学 (NAMD、Tinker-HP)、材料モデリング (Quantum Espresso) などの分野で一般的な HPC アプリケーションの Arm アーキテクチャ向けのバージョンも提供しています。
アプリケーションは、GPU 最適化ソフトウェアのレジストリである NGC catalog のコンテナーとして提供されています。それらのコンテナーによって Arm ベース システムへのアプリケーションの展開が簡素化されるため、研究者は各自の科学研究に専念することができます。
より多くのパートナーが Arm の拡張をサポート
Arm ベース プロセッサと NVIDIA GPU の組み合わせによるパワーが、スーパーコンピューティング センターを以外のハイパフォーマンス コンピューティングのニーズに応えています。
たとえば、NVIDIA GPU と Ampere Computing の Ampere Altra CPU は、データ センターからクラウドまで、さまざまな市場で利用されています。また、エッジ コンピューティングでは、NVIDIA は Marvell Semiconductor と連携して、同社の Arm ベース プロセッサ OCTEON と NVIDIA の GPU を組み合わせ、ネットワークの最適化とセキュリティの実現に向け AI ワークロードの高速化を図っています。
NVIDIAのコラボレーションには、システム プロバイダーも含まれています。たとえば GIGABYTE は、アクセラレーテッド Arm サーバーの提供を主導してきました。
「NVIDIA の GPU と DPU、そして Ampere Altra CPU を搭載した Arm サーバーのポートフォリオで Arm エコシステムに参加でき、光栄に思います」と、GIGABYTE の CEO であるエタイ リー (Etay Lee) 氏は述べ、以下のように続けます。
「当社は NVIDIA と連携して、ハードウェアからソフトウェア開発ツール、Arm アプリケーションまで、Arm エコシステムの拡大に取り組み、業界を超えてお客様が HPC ワークロードを加速できるよう支援しています。」
今後の予定
12 社の OEM から 40 種類近いシステムからなる NVIDIA-Certified Systemsを拡大して Arm 搭載システムを加えることで、企業が確信をもって展開できる検証済みシステムの選択肢を拡充します。
GIGABYTE と Wiwynn は、Arm Neoverse ベースの CPU と NVIDIA の Ampere GPU または BlueField-2 あるいは両方を搭載したサーバーの提供を計画しています。これらのサーバーは来年提供が開始される見込みで、市場化に伴い NVIDIA の認証を受ける手続きが行われる予定です。
Arm、NVIDIA、およびパートナーの協業によって実現する、高いエネルギー効率のアクセラレーテッド コンピューティングが持つ可能性はまだまだこれだけではありません。
詳しくは、6 月 28 日 (太平洋時間) に行われた、NVIDIA のマーク ハミルトン (Marc Hamilton)による「NVIDIA ISC 2021 Special Address」の最新ニュースをご視聴ください。