NVIDIA

お使いのブラウザーは対応していません。

お使いのウェブブラウザーはこのウェブサイトでは対応していません。いくつかの機能が正常に動作しない可能性がございます。アップグレートいただくか下記のブラウザーのどれかをインストールください。よろしくおねがいします。

米国立エネルギー研究科学計算センターで世界最速のAIスーパーコンピューターが稼働

hdr-nersc-perlmutter-ai-supercomputer

6,000 基の NVIDIA A100 GPU が 4 エクサフロップスの混合精度性能を提供し、NERSC の科学の進歩を支援

米国立エネルギー研究科学計算センター (NERSC) で米国時間27日に除幕式が行われる Perlmutter は、宇宙の 3 次元地図の作製や、グリーンエネルギー源のための素粒子相互作用の探求などに役立てられる予定のスーパーコンピューターです。7,000 人以上の研究者に約 4 エクサフロップスの AI 性能を提供します。

つまり、Perlmutter は AI が使用する 16 ビットと 32 ビットの混合精度演算において、地球上で最速のシステムということです。しかも、この性能には、年内にローレンス バークレー国立研究所に置かれる本システムに予定されているフェーズ 2 の性能は含まれていません。

現在、24 種類以上のアプリケーションを、世界最大の A100 搭載システムである Perlmutter の 6,159 基の NVIDIA A100 Tensor コア GPU で初めて動かすための準備が進められています。いずれも、天体物理学や気候科学をはじめとする科学の進歩を目指しています。

宇宙の 3 次元地図

あるプロジェクトでは、Perlmutter を利用して過去最大の 3 次元可視宇宙地図を作製します。Perlmutter は、1 回の露光で 5,000 もの銀河を捉えることができる宇宙カメラの一種である暗黒エネルギー分光計器 (DESI) からのデータを処理します。

研究者が一夜で数十回の露光を捉えて、次の夜に DESI を向ける方角を知るためには、Perlmutter の GPU のスピードが必要です。1 年分の公開データの準備には、従来のシステムでは数週間から数か月を要しましたが、Perlmutter はわずか数日で完了させるのに役立つでしょう。

NERSC のデータ アーキテクトで、研究者のコードを Perlmutter に対応させるのを支援しているローリン トーマス (Rollin Thomas) 氏は、「予備研究では GPU によって 20 倍の高速化が達成され、本当に満足しています」と述べています。

パールマッター氏の飽くなき好奇心が結実

DESI の地図は、加速し続ける宇宙の膨張の裏にある不思議な物理である暗黒エネルギーに光を当てることを目的にしています。暗黒エネルギーは、バークレー研究所の現役天体物理学者で、新しいスーパーコンピューターの名前の由来となった、2011 年にノーベル賞を受賞したソール パールマッター (Saul Perlmutter) 氏の研究によって主に発見されました。

ノーベル賞受賞につながった発見に続くプロジェクトで、パールマッター氏と共に研究を行ったトーマス氏は、「私にとって、パールマッター氏は、飽くなき好奇心と楽観主義へのこだわりを正しく組み合わせることで、人間に何ができるかを示すよい例です」と述べています。

スーパーコンピューターが AI と HPC を融合

NERSC の新しいスーパーコンピューター上で実行される多くのプロジェクトも、同様の精神によって支えられています。たとえば、材料科学の研究は、バッテリーやバイオ燃料の改善への方向性を示す可能性がある原子相互作用の発見を目指しています。

従来のスーパーコンピューターでは、Quantum Espresso などのプログラムで、原子数個のシミュレーションを数ナノ秒間にわたって生成するのに必要な計算を処理するのがやっとでした。しかし、極めて正確なシミュレーションと機械学習を組み合わせることで、より多くの原子を、より長い時間にわたって研究できるようになります。

NERSC のアプリケーション パフォーマンス スペシャリストで、研究者のプロジェクト立ち上げを支援しているブランドン クック (Brandon Cook) 氏は、「従来、バッテリーの界面のような大きな系の完全な原子シミュレーションを行うことは不可能でしたが、今や科学者は Perlmutter を利用してその計画を立てています」と述べています。

そこで特別の役割を果たすのが A100 の Tensor コアです。Tensor コアは、シミュレーションのための倍精度浮動小数点演算と、ディープラーニングに必要な混合精度演算の両方を高速化します。

同様の研究が昨年 11 月、NVIDIA V100 GPU を使用した BerkeleyGW プログラムで、ゴードン ベル賞の最終候補として NERSC に認められました。NERSC でプロジェクトの指揮とアプリケーション性能の監督の任に当たるジャック デスリッペ (Jack Deslippe) 氏は、「A100 の有り余る性能は、そうした取り組みのレベルを引き上げることを約束します」と述べています。

ソフトウェアが Perlmutter を支える

デスリッペ氏は、システムが使用する NVIDIA HPC SDK に含まれる OpenMP やその他のプログラミング モデルのサポートを挙げ、「ソフトウェアも Perlmutter の戦略的要素です」と言います。

これとは別に、GPU 向けのデータ サイエンス用オープンソース コードである RAPIDS は、NERSC の拡大する Python プログラマー チームの研究を迅速化することが期待されます。RAPIDS は、NERSC の Cori スーパーコンピューター上のすべてのネットワーク トラフィックを解析するプロジェクトにおいて、従来の CPU を使用した研究の約 600 倍もの高速化という価値をもたらしました。

「RAPIDS がデータによる科学的発見の加速において大きな役割を果たすと確信しました」とトーマス氏は述べています。

コロナ禍への対処

Perlmutter は、コロナ禍にもかかわらず、予定通りに進んでいます。しかし、チームはシステムのエクサスケールのアプリケーションのコードに関する、在宅勤務の研究者によるハッカソンの実施方法といった重要な手順の見直しを迫られました。

その一方で、Hewlett Packard Enterpriseのエンジニアは、新しいシステムに対応できるように施設のアップグレードを行ったNERSC スタッフと協力しながら、システムのフェーズ 1 の構築に貢献しました。「特に現在のコロナ禍の厳しい制約の中で、現場でシステムの立ち上げに尽力してくれた人々には深く感謝しています」とトーマス氏は述べています。

NVIDIA の創業者/CEO であるジェンスン フアン (Jensen Huang) は、バーチャルのローンチ イベントで、Perlmutter によって科学を進歩させる計画について、バークレー研究所のスタッフを祝福しました。

「Perlmutter の AI とハイパフォーマンス コンピューティングを融合する能力は、材料科学や量子物理学、気候予測、生物学研究をはじめとする幅広い分野におけるブレイクスルーにつながるでしょう」とフアンは述べています。

スケジュールどおりに AI スーパーコンピューターが稼働

バーチャル除幕式は、まさに 1 つのマイルストーンです。

「科学向け AI は、米国エネルギー省の重点分野であり、素粒子物理学、材料科学、バイオエネルギーといった分野で、概念実証から本格稼働への移行が進んでいます」と語るのは、NERSC でデータおよびアナリティクス サービス グループのリーダーを務めるワヒド ビムジ (Wahid Bhimji) 氏です。「ニューラルネットワーク モデルはますます大規模化が進んでおり、より強力なリソースを利用したいという需要があります。A100 GPU、オールフラッシュ ファイル システム、およびストリーミング データ機能を搭載した Perlmutter は、こうした AI のニーズに対応する上で絶好のタイミングです。」

Perlmutter の利用を希望する研究者は、システムの利用申請を提出することができます。


You may also like...