NVIDIA の新しい CPU 「Grace」が世界で最も強力な AI 対応スーパーコンピューターに採用

投稿者: Dion Harris

スイス国立スーパーコンピューティング センターの 「Alps」 システムで幅広い分野における画期的な研究が可能になります。

NVIDIA の新しい Grace CPU により、世界で最も強力な AI 対応スーパーコンピューターが誕生します。

スイス国立コンピューティング センター (CSCS) の新しいシステムは、NVIDIA が本日から発表した Arm ベースの革新的なデータセンター CPU である Grace を採用予定です。これにより、幅広い分野で画期的な研究が可能になります。

気候や天候から、材料科学、天体物理学、数値流体力学、生命科学、分子動力学、量子化学、素粒子物理学、さらには経済学や社会科学などの分野に至るまで、Alps が稼働する 2023 年には、ヨーロッパ全土および世界中において科学を進歩させる上で重要な役割を果たすでしょう。

NVIDIA の 創業者/CEO であるジェンスン フアン (Jensen Huang) は、NVIDIA の GTC テクノロジ カンファレンスで月曜に行われた基調講演で次のように述べています。「スイス国立スーパーコンピューティング センターが Grace と NVIDIA の次世代 GPU を搭載したスーパーコンピューターを構築することを発表でき嬉しく思います。」

Alps は、Hewlett Packard Enterprise が新しい HPE Cray EX スーパーコンピューター製品ラインと、NVIDIA GPU や NVIDIA HPC SDK、そして新しい Grace CPUを搭載した NVIDIA HGX スーパーコンピューティング プラットフォームを用いて構築する予定です。

Alps システムは、現在利用されている CSCS の Piz Daint スーパーコンピューターに代わって設置されます。

AI による新タイプのスーパーコンピューティング

Alps は、GPU アクセラレーテッド ディープラーニングを利用することで、従来のモデリングやシミュレーションを超えてスーパーコンピューティングを拡張する、新世代のマシンの 1 つです。

CSCS のディレクターであるトーマス シュルテス (Thomas Schulthess) 氏はこう述べます。「ディープラーニングは非常に強力なツール セットであり、私たちもツールボックスに取り入れています。」

Alps は、NVIDIA の CPU と GPU 間の緊密な結合を利用することで、世界最大の自然言語処理モデルである GPT-3 をわずか 2 日でトレーニングできると期待されています。この処理速度は、現在 AI 向けスーパーコンピューターの中で世界最高性能と知られている NVIDIA Selene スーパーコンピューターが MLPerf で記録した 2.8 AI-ExaFlop の実に 7 倍です。

CSCS ユーザーはこの驚異的な AI 性能を、自然言語理解のメリットが得られるさまざまな新しい科学研究に応用できます。

例えば、科学論文に記述された膨大な知識の分析と理解、創薬のための新しい分子の生成、などでの活用が期待されます。

新しいマシンの真髄

数十億のスマートフォンやエッジ コンピューティング デバイスに利用されている超効率的な Arm マイクロアーキテクチャをベースとしている Grace は、最も複雑な AI とハイパフォーマンス コンピューティングのワークロードにおいて、今日の最速のサーバーの 10 倍のパフォーマンスを提供します。

Grace は次世代の NVIDIA のコヒーレントな NVLink 相互接続テクノロジをサポートし、システム メモリ、CPU、GPU の間でのデータ移動がさらに高速になります。

また、かつてないほどの大規模なデータ サイエンス アクセラレーションに対する GPU のサポートが拡大することで、Alps は最新のスーパーコンピューティングに必要となる膨大な量のデータの取り込みなど、ユーザーのワークフローのより大きな部分を加速することもできます。

シュルテス氏は次のように述べます。「科学者はシミュレーションの実行だけでなく、データの前処理や後処理もできるようになります。これにより、ワークフロー全体がより効率的になります。」

素粒子物理学から天気予報まで

CSCS は、特に材料科学、天気予報、気候モデリングの分野における最先端で研究を続け、新世代の科学機器から得られるストリーミング データについての造詣が深い科学者たちを長い間サポートしてきました。

CSCS は、スイスの気象サービスである MeteoSwiss の代わりに数値気象予報 (NWP) 専用のシステムを設計および運用しており、このシステムは 2016 年から GPU 上で稼働されています。

NWP の運用と GPU 利用における長年の経験は、気候シミュレーションの将来を握る鍵にもなります。つまり、気候の長期的な変化をモデル化するだけでなく、異常気象をより正確に予測して人命を救うことができるモデルを構築するための鍵となるということです。

担当チームの目標の 1 つが、雷雲などの対流雲をマッピングできる、空間解像度 1km の全球気候モデルを実行することです。

CSCS スーパーコンピューターは、スイスの科学者たちが欧州原子核研究機構 (CERN) にある大型ハドロン衝突型加速器 (LHC) から得たデータを分析する用途でも使用されており、Worldwide LHC Computing Grid (WLCG) のスイス Tier-2 システムの役割を担っています。

ジュネーブに設置されている LHC は、90 億ドルという史上最も高価な科学機器の 1 つであり、年間 90 ペタバイトのデータを生成します。

Alps では、幅広いプロジェクトをサポートできる新しいソフトウェアデファインドのインフラストラクチャを使用します。

そのため、将来的には MeteoSwiss のチームなどの多様なチームが、別々のマシンではなく単一の統合インフラストラクチャで 1 つまたは複数のパーティションを使用できるようになります。

これらは、個人ユーザー用の仮想アドホック クラスターや、研究チームが CSCS と共同で作成し自ら運用できる事前定義済みクラスターとして利用できます。

画像出典:Steve Evans 氏、『Citizen of the World』