NVIDIA のアクセラレーテッド コンピューティングと AI プラットフォームを使用して、4 チームがゴードン ベル賞の本賞または COVID 研究特別賞のファイナリストにノミネートされ、そのうちの 2 チームは驚異的な 10 億個の原子のシミュレーションを行いました。
10 億個の原子を対象とした 2 つのシミュレーション、SARS-CoV-2 ウイルスの仕組みについての新たな 2 つの知見、そして創薬を加速する新しい AI モデル。
上記は、ハイ パフォーマンス コンピューティング界のノーベル賞とも言われるゴードン ベル賞のファイナリストに選出された研究結果です。これらは NVIDIA のテクノロジを用いて、AI、アクセラレーテッド コンピューティング、またはその両方で科学を進歩させています。
COVID-19 研究特別賞のファイナリストに、AI を使用して複数のシミュレーションを結び付け、ウイルスが宿主内でどのように複製するかを新たなレベルで明確に示した研究チームがあります。
アルゴンヌ国立研究所の計算生物学者であるアルヴィンド ラマナサン (Arvind Ramanathan) 氏が率いるこの研究では、タンパク質構造の探索に使用する従来のツールの解像度を向上させる方法が示されています。この方法により、ウイルスの拡散を阻止する方法に対する新たな知見が得られる可能性があります。
米国と英国の 12 の組織から構成されたこのチームは、Hewlett Packard Enterprise が構築し NVIDIA A100 を搭載したシステム、Perlmutter やアルゴンヌ国立研究所の NVIDIA DGX A100 システムなどのシステム間で実行されるワークフローを設計しました。
「統合生物学向けのマルチサイト データ分析とシミュレーションを実行できる能力は、転送が難しい大規模な実験データを利用する上で非常に貴重になるだろう」と論文に記されています。
その作業の一環として、研究チームは GPU 上で一般に使用される NAMD プログラムを使用して分子動力学研究を高速化する技術を開発しました。また、NVIDIA NVLink を活用し、「従来の HPC ネットワーク相互接続やPCIe 転送で現在可能な速度をはるかに超える」データの高速化を実現しました。
10 億個の原子を忠実に再現
サウス フロリダ大学の物理学教授であるイヴァン オレイニク (Ivan Oleynik) 氏率いるチームは、初の 10 億個の原子の高精度シミュレーションを作り出した業績が評価され、ゴードン ベル賞本賞のファイナリストにノミネートされました。この記録は昨年のゴードン ベル賞受賞チームが打ち立てた記録を 23 倍も更新しました。
「これまでに見たことのない現象を発見することは喜びであり、私たちは本当に大きなこの成果を誇りに思います」とオレイニク氏は述べています。
極端な温度と圧力の下で行う炭素原子のシミュレーションにより、新しいエネルギー源の発見や、遠い惑星の構造の説明が可能になるかもしれません。特にこのシミュレーションが量子レベルの精度を持ち、原子間の力を忠実に反映していることは驚くべきことです。
「強力な GPUを搭載したスーパーコンピューターに機械学習の手法を適用することによってしか、この精度は達成できません。AI は科学の手法に革命をもたらしています」とオレイニク氏は述べています。
同チームは、IBM が構築した世界で最も強力なスーパーコンピューターの 1 つである米国エネルギー省のスーパーコンピューター Summit 上で、4,608 台の IBM Power AC922 サーバーと 27,900 基の NVIDIA GPU を使用しました。このスーパーコンピューターにより、チームのコードが 200 億個以上の原子のシミュレーションにほぼ 100% の効率でスケーリングできることが示されました。
このコードは、材料科学の限界を押し広げたいと考える研究者向けに誰でも利用できるよう公開されています。
命取りとなる飛沫の内部
10 億原子のシミュレーションがもう 1 件あります。もうひとつの COVID-19 賞のファイナリストが、空中の飛沫に含まれるデルタ株を明らかにしました (下図)。これにより、COVID などの病気を広める生物学的な力が解明され、エアロゾルを原子レベルで初めて観察できるようになりました。
特別賞を昨年受賞したカリフォルニア大学サンディエゴ校の研究員、ロミー アマロー (Rommie Amaro) 氏が率いるこのチームの論文によると、この研究は「肺深部でのウイルス結合や、その他の空気感染する病原体の研究に広範囲に影響を及ぼす」といいます。
「AI を複数のレベルで HPC と組み合わせることで、効果的なパフォーマンスを大幅に向上させ、複雑な生物学的システムを理解して調査する新しい方法が実現することを、私たちは実証しています」とアマロー氏は述べています。
研究者たちは、Summit、テキサス大学TACC (Texas Advanced Computer Center) 向けに Dell Technologies が構築したLonghornスーパーコンピューター、および Oracle Cloud Infrastructure (OCI)の商用システム上で、NVIDIA GPUを使用しました。
「HPC とクラウド リソースを使用することで、主な科学的取り組みの解決までの時間が大幅に短縮されるだけでなく、研究者同士を結び付け、複雑な共同作業を可能にします」とチームは結論付けています。
創薬の言語
オークリッジ国立研究所 (ORNL) も COVID 賞のファイナリストに選出されています。このチームは新薬候補化合物のスクリーニングにおける問題に自然言語処理 (NLP) を適用しました。
チームは、96 億個の分子を含むデータセット (これまでにこのタスクに適用された中で最大のデータセット) を使用して、新薬の発見を加速できる BERT NLP モデルを 2 時間でトレーニングしました。それ以前は、11 億個の分子からなるデータセットを使用してモデルをトレーニングするのに 4 日間を要していました。
この作業では、Summit スーパーコンピューター上で 24,000 基を超える NVIDIA GPU を実行することで、603 ペタフロップスという驚くべき性能を実現しました。トレーニングが完了してしまえばモデルを単一の GPU で実行でき、研究者は COVID などの病気を抑制する可能性のある化合物を見つけることに役立ちます。
「このモデルをがんのシグナル伝達経路に応用したいと考える共同研究者がいます」と、ORNL の計算科学者であるイェンス グレイザー (Jens Glaser) 氏は言います。
チームを率いたリサーチ サイエンティストのアンドリュー ブランチャード (Andrew Blanchard) 氏は次のように述べています。「私たちは、トレーニング データのサイズに関しては始めの一歩を踏み出したに過ぎません。近いうちに1 兆個の分子を使用したいと願っています」
フル スタック ソリューションに期待
AI およびアクセラレーテッド コンピューティング向けの NVIDIA ソフトウェア ライブラリのおかげで、同チームは驚くほど短期間で作業を終えることができました。
「GPU の Tensor コア用に私たちの研究を完全に最適化する必要はありませんでした。特別なコードは必要とせず、標準スタックを使用するだけでした」とグレイザー氏は述べています。
同氏は多くのファイナリストが感じていることを次のようにまとめています。「人々の生活に影響を与える可能性のある有意義な研究に参加するチャンスがあることは、科学者にとって非常に満足できることです」
11 月 15 日 (月) 午後 3 時 (太平洋標準時間) に開催されたSC21での特別講演は、オンデマンドで配信されていいます。NVIDIA のマーク ハミルトン (Marc Hamilton) が 説明する NVIDIA の最新情報、イノベーション、テクノロジの概要をご視聴いただけます。