NVIDIA のスーパーチップとソフトウェアで、スーパーコンピューター、各種機器、拡大する量子コンピューティング エコシステムの画期的な機能を実現
今日の大きな課題に取り組んでいる研究者は、欧州で毎年開催されるスーパーコンピューティング エキスパートの国際会議である ISC で示されたように、アクセラレーテッド コンピューティングで成果を上げています。
NVIDIA のアクセラレーテッド コンピューティング担当バイス プレジデント、イアン バック (Ian Buck) は、ハンブルクで行われた ISC の特別講演で次のように述べました。「新しいエネルギー源のシミュレーションを行うためにデジタル ツインを構築している研究者や AI とハイパフォーマンス コンピューティング (HPC) を使用して人間の脳を探究している研究者がいます。」
「さらに、非常に高感度な機器と共に HPC をエッジに持ち込み、ハイブリッド量子システムでシミュレーションを加速している研究者もいます。」
10 エクサフロップスの AI の実現
たとえば、Venado と呼ばれるロスアラモス国立研究所 (LANL) の新しいスーパーコンピューターでは、材料科学や再生可能エネルギーなどの分野の研究を推進するために、10 エクサフロップスの AI パフォーマンスが達成される見込みです。
このニューメキシコ州北部の山頂の名前が付けられたシステムで、LANL の研究者は NVIDIA の GPU、CPU、DPU を使用し、マルチフィジックスのコンピューティング アプリケーションで 30 倍の高速化を目指しています。
Venado では、以前の GPU よりもワークロードの実行を最大 3 倍高速化するために、NVIDIA の Grace Hopper Superchipが採用されます。また、NVIDIA Grace CPU Superchipも搭載し、多数の非アクセラレーテッド アプリケーションで従来型 CPU の 2 倍の電力性能比を実現します。
勢いを増す BlueField
LANL システムの他にも、世界中の多数の最新システムが NVIDIA BlueField DPU を採用して、通信とストレージのタスクをホスト CPU から解放し、高速化しています。
テキサス先端計算センター (The Texas Advanced Computing Center : TACC) でも、Lonestar6 上の NVIDIA Quantum InfiniBand ネットワークに BlueField-2 DPU を導入しています。これは、クラウドネイティブ スーパーコンピューティング用の開発プラットフォームとなり、ワークロードをセキュアに分離する一方で、ベアメタルレベルのパフォーマンスで複数のユーザーとアプリケーションをホストする予定です。
「これは、次世代のスーパーコンピューティングと HPC クラウド向けの人気のあるアーキテクチャです」とバックは述べました。
欧州でのエクサスケール
欧州で、NVIDIA と SiPearl は、Arm 上にエクサスケールのコンピューティングを構築している開発者のエコシステムを拡大するために協働しています。この活動では、NVIDIA のアクセラレーテッド コンピューティングとネットワーキング テクノロジと共に SiPearl の Rhea や将来の Arm ベースの CPU を採用するシステムにアプリケーションを移植するために、この地域のユーザーを支援します。
筑波大学計算科学研究センターでは、NVIDIA Quantum-2 InfiniBand プラットフォーム上に NVIDIA H100 Tensor コア GPU と x86 CPU を組み合わせて構築しています。この新しいスーパーコンピューターは、気候学、天体物理学、ビッグデータや AI などでの利用を予定しています。
スーパーコンピューターの最新の TOP500 リストでは 71% が NVIDIA のテクノロジを採用います。また、このリストに含まれる新しいシステムの 80% は NVIDIA の GPU、ネットワークまたはその両方を採用しており、NVIDIA のネットワーキング プラットフォームは TOP500 システムで最も人気のあるインターコネクト プラットフォームです。
HPC ユーザーは、従来のスーパーコンピューティング ワークロード (シミュレーション、機械学習、リアルタイムのエッジ処理) と新たなワークロード (量子シミュレーションやデジタル ツインなど) に対して最高のアプリケーション パフォーマンスを提供するため、NVIDIA テクノロジを採用しています。
Omniverseを使用して、核融合炉のデジタル ツインを構築
このようなシステムで実行できることを示すために、バックは、英国原子力公社とマンチェスター大学の研究者が NVIDIA Omniverse 上で構築している仮想の核融合炉のデモ動画を披露しました。このデジタル ツインは、プラント全体、そのロボティクスの構成要素、さらにはコアにおける核融合プラズマの挙動に関するリアルタイム シミュレーションを目的としています。
3D デザイン コラボレーションおよび世界のシミュレーション プラットフォームである NVIDIA Omniverse では、離れた場所にいるプロジェクトの研究者が、さまざまな 3D アプリケーションを使用して、リアルタイムに協業することができます。研究者は、物理情報に基づく AI モデルを作成するためのフレームワーク、NVIDIA Modulus で研究成果を高めることを目指しています。
「これは、将来のクリーンな再生可能エネルギー源を実現するための極めて複雑な研究です」とバックは話しました。
医用画像のための AI
さらに、バックは、AI によるヘルスケアの発展に特化したスーパーコンピューター NVIDIA Cambridge-1 で、研究者が10万枚に及ぶ、人間の脳の合成画像のライブラリをどのように作成したかを説明しました。
キングス カレッジ ロンドンのチームは、医用画像のための AI フレームワークである MONAI を使用して、研究者がパーキンソン病などの疾病がどのように進行するかを確認するために役立てることができるリアルな画像を生成しています。
「これは、HPC と AI の組み合わせが、科学研究コミュニティに実際に貢献していることを示す優れた例です」とバックは言いました。
エッジにおける HPC
HPC の処理は、スーパーコンピューター センターを越えて拡大し続けています。観測所、衛星、新しい種類の研究用機器は、リアルタイムにデータをストリーミングし、可視化する必要があります。
たとえば、ローレンスバークレー国立研究所のライトシート顕微鏡の研究では、NVIDIA Clara Holoscan を使用して、ナノメートル単位でリアルタイムに生物を観察しています。これは、CPU では数日かかる処理です。
スーパーコンピューティングをエッジにもたらすために、NVIDIA は HPC 向けの Holoscan を開発しています。これは、NVIDIAの画像処理ソフトウェアの極めて拡張性の高いバージョンであり、あらゆる科学的な発見を加速させます。Jetson AGX モジュールおよびアプライアンスから 4台のA100 サーバーまで、複数のアクセラレーテッド プラットフォームにわたって動作する予定です。
「研究者がこのソフトウェアをどのように活用するかが非常に楽しみです」とバックは述べました。
量子シミュレーションの高速化
スーパーコンピューティングのもう 1 つの方向性として、バックは、GPU で量子回路シミュレーションを加速するためのソフトウェア開発キット、NVIDIA cuQuantum の採用が急速に普及していることを報告しました。
数十の組織が、多くの分野にわたる研究で既にこれを活用しています。これは、追加のコーディングなしで GPU アクセラレーションを利用できるように、主要な量子ソフトウェア フレームワークに統合されています。
最近、AWS は、Braket サービスで cuQuantum を提供することを発表しました。また、コストを 3.5 倍削減する一方で、量子機械学習ワークロードを最大 900 倍まで高速化できることを実証しました。
バックは次のように述べました。「量子コンピューティングは膨大な可能性を秘めており、GPU スーパーコンピューターで量子コンピューターをシミュレートすることは、価値ある量子コンピューティングの実現に近づくために不可欠です。この研究の最前線にいることを、非常に喜ばしく思っています。」