時代の変わり目: 世界の TOP500 スーパーコンピューターに求められているのは、速さとともにスマートさ

投稿者: Chintan Patel

世界の最高峰のスーパーコンピューターのおよそ 70% が NVIDIA のテクノロジを利用し、AI によって研究者の発見に貢献

世界の最高峰のスーパーコンピューターは、これまでより高速になっているだけではありません。よりスマートになっており、多様なワークロードにも対応しています。

SC20 で発表された、世界最速のスーパーコンピューター TOP500 リストのうちおよそ 70%、および上位 10 システムのうちの 8 システムで NVIDIA のテクノロジが採用されています。

また、スーパーコンピューターの最も権威ある賞であり、今週 SC20 で発表されるゴードン ベル賞の候補のうちの 4 つが、その発見を推進するために AI を活用しています。

それらすべてで採用されているのが、科学技術計算、データ分析および AI ワークロードを加速する、エンドツーエンドのHGX AI スーパーコンピューティング プラットフォームです。優れたチップと、きわめて高速でスマートなネットワーキングからはじまり、それが最終的には全世界で採用され、優れた科学のために、NVIDIA のデータセンタースケールのプラットフォームへと発展しました。

HPC に AI を組み込むという流れ、さらに従来のスーパーコンピューティング センターを凌駕するプラットフォームの誕生は、Seymour Cray の CDC 6600 が 1964 年に登場して以来、演算集中型のシミュレーションとモデリングのために、これまでにない大規模な強力なマシンを活用することに着目していましたが、この分野に大きな変化が訪れていることを示しています。

最新の TOP500 リストでは、高い性能を立証した、Linpack の結果以上の成果が明らかにされています。

  • 速度の記録(Speed records): FP64 と呼ばれる、倍精度の浮動小数点形式での計算速度で行われる、従来のベンチマークによる測定で、NVIDIA のテクノロジが上位 10 マシンのうちの 8 つで採用されており、世界の最速マシンを加速させています。これには、第 5 位にランクされている、世界で最もパワフルな商用システムである NVIDIA が独自で開発した Selene スーパーコンピューターとともに、第 7 位の JUWELS (Forschungszentrum Jülich) や第 10 位の Dammam-7 (Saudi Aramco) といった新登場のシステムが含まれています。
  • 「スマートさ」の記録 (Smart records): AI 性能のベンチマークとなる混合精度規格である HPL-AI での測定では、NVIDIA のテクノロジを活用したマシンがリストの上位を占め、オークリッジ国立研究所の Summit スーパーコンピューターが 0.55 エクサフロップス(EFLOPS)の記録を、NVIDIA Selene が 0.25 EFLOPS の記録を打ち立てました。
  • 環境配慮での記録 (Green records) : NVIDIA DGX SuperPOD システムが、最も効率性の高いスーパーコンピューターを格付けする Green500 リストの首位となり、ワット当たり26.2 ギガフロップス(GFLOPS) という電力効率での世界新記録を樹立しました。全体としては、NVIDIA のテクノロジを活用したマシンが、リストの上位 30 のうちの 25 を占めました。

AI スーパーコンピューティングの時代が急接近

おそらく最も印象的な成果は、私たちが、予定よりかなり早くにエクサスケール コンピューティングを達成したということでしょう。

10 月にイタリアの CINECA スーパーコンピューティング センターが、10 EFLOPS の AI 性能が予想されている、世界で最もパワフルな AI スーパーコンピューター、Leonardo を構築する計画を明らかにしました。これに続いて、チェコ共和国、ルクセンブルクおよびスロベニアで新しい EuropHPC AI システムの計画が次々と公表されました。ヨーロッパだけではなく、アジアや北米でもさまざまな予定が立てられています。

その理由は、現代の AI は、NVIDIA GPU や NVIDIA CUDA-X ライブラリ、ならびに世界で唯一のスマートで、完全に加速化されたネットワーク内コンピューティング プラットフォームである NVIDIA Mellanox InfiniBand といった驚異的な並列処理性能を持つテクノロジを活用し、大量のデータを最新のニューラル ネットワークに送り込んで、私たちの周囲の世界の洗練されたモデルを作り上げることが可能になっているからです。これにより、科学者は、これまでの常識を越えた、はるかに野心的なプロジェクトに取り組めるようになっています。

その一例が、今年のゴードン ベル賞の候補となっている、ローレンス バークレー国立研究所のコンピュテーショナル リサーチ部門です。AI の活用により、同チームは、分子動力学のシミュレーションの規模を、過去の候補者がシミュレーションに使っていた、最も大きなシステムと比較して、少なくとも 100 倍に拡大できるようになりました。

科学の進歩について

もちろん、大切なのはシステムの速さだけではありません。対象となる現実世界でその速さをいかに活用するかが重要となります。

そうした例は、AI を活用して COVID との戦いの最前線に挑む人々のなかに見ることができます。
COVID-19 パンデミックとの戦いに焦点を当てた、特別ゴードン ベル賞の 4 つの候補のうちの 3 つが、NVIDIA の AI テクノロジを活用しています。

TOP500 の 3 位にランクされている、ローレンス リバモア国立研究所の Sierra スーパーコンピューターを使って、あるチームは AI をトレーニングして、16 億の化合物から新しい薬剤候補をわずか 23 分で見つけられるようになりました。

TOP500 の 2 位にランクされている、オークリッジ国立研究所の Summit スーパーコンピューターでは、別のチームが 27,612 基の NVIDIA GPU を使って、2 つの主要な SARS-CoV-2 タンパク質構造で、毎秒 19,028 の薬剤加工物候補をテストできるようになりました。

Summit を使って AI 主導型のワークフローを作り、主要なウイルス感染機構である SARS-CoV-2 スパイクタンパク質がヒトの ACE2 受容体を攻撃する様子をモデリングしたチームもあります。

プロセッサからネットワーキング、ソフトウェアに至るすべてを含む、スケーラブルな NVIDIA HGX AI スーパーコンピューティング プラットフォームが広く普及するようになったため、科学者は、クラウド コンピューティング会社のハイパースケール データセンターやスーパーコンピューターでワークロードを実行できるようになっています。

NVIDIA HGX AI スーパーコンピューティング プラットフォームは統合的なプラットフォームであり、ハイパフォーマンス コンピューティングやデータ分析、AI ワークロードを組み込むことができます。230 万人の開発者が利用しており、1,800 以上のアクセラレーテッド アプリケーション、すべての AI フレームワーク、および DASK や Spark といった人気のデータ分析フレームワークに対応しているため、このプラットフォームの利用によって、科学者と研究者は、GPU を活用した x86 や Arm、Power システムで生産性を即座に向上させることができます。

また、NVIDIA NGC catalogを通じて、HPC および AI アプリケーションの最新バージョンに対応する、性能を最適化されたコンテナを利用することができます。そのため、科学者および研究者は、これらを迅速に導入し、科学の進歩に絶えず取り組むことができるようになります。

詳細は、NVIDIA SC20 の特別演説 でご覧いただけます。