世界で最も強力なスーパーコンピューターであり、エクサ OPS 級として初となる AI システムが、27,648 基の NVIDIA GPU を利用して科学者の研究を加速
オークリッジ国立研究所で金曜日にデビューを果たした Summit は、今まで作られた中で最も強力な科学研究ツールと呼ぶにふさわしく、コンピューティングの新しいパラダイムと呼ぶにもふさわしいでしょう。
27,648 基の Volta Tensor コア GPU を備えたこの巨大なマシンは、3 エクサ OPS 以上での動作が可能です。すなわち、1 秒あたり 300 京回以上の計算ができるということです。これは、完成してからまだ 5 年しか経っておらず、以前は米国内で最速だったスーパーコンピューター Titan と比べ、100 倍以上速いスピードです。しかも、この計算能力の 95 パーセントが GPU に由来しています。
米国エネルギー省のために開発されたこのマシンは、現代の重大課題に立ち向かえるよう設計されました。このマシンは、世界トップクラスの科学者が取り組んでいる、高エネルギー物理学や新材料発見、また医療やその他の研究を加速します。そのために役立てられるのが、高精度の科学シミュレーションに向け 200 ペタ FLOPS の計算能力を送り出す能力です。
オークリッジ国立研究所で登壇する NVIDIA の CEO ジェンスン フアン
NVIDIA の CEO であるジェンスン フアン (Jensen Huang) は、Summit がお披露目された金曜日にこう述べています (英語スピーチの全文はこちらからご覧ください)。「Summit は高速です。しかしそれだけでなく、Summit にはもっと際立った意義があります。このマシンは壮大な科学研究用マシンであり、世界の一流科学者たちを引き付けることになるのです」
まさにこれは、科学におけるタイム マシンと言えます。
このストーリーの裏にあるさらなるストーリーをご紹介しましょう。オークリッジのチームは、10 年近く前、新しい種類のコンピューティングが必要であるということに、米国内で初めて思い至りました。トランジスタ同士を積み重ねるだけの古いパラダイムでは、チームにとって必要な性能が得られなかったのです。
チームはリスクを取り、各ノードに GPUを 1 基ずつ備えた世界最速のスーパーコンピューター Titan を 2012 年に開発しました。チームの勇気は報われました。今では 550 以上の ハイパフォーマンス コンピューティング(HPC)アプリケーションが GPU の支援を受けており、もっとも広く使われているアプリケーション 15 個もすべてここに含まれています。チームは、スーパーコンピューティングの新たな局面を開きました。
コンピューティングの新章を描く
Summit はいわば、新たな章です。オークリッジ国立研究所にとってだけではありません。コンピューティングすべてに対しての新章なのです。NVIDIA の研究チームは先進技術に関するエネルギー省との共同作業を 11 年以上続けています。その技術の例としては、Volta GPU や高速相互接続技術の NVLink があり、これらは Summit の心臓部にも搭載されています。ノードごとに搭載される GPU は、Summit の場合 1 基ではなく、Tensor コア GPU 6 基となっています。これにより、シミュレーション性能は Titan の 10 倍に達しています。
また、Titan がきっかけになって世界のシミュレーションが加速されたのとちょうど同じように、Summit も世界の科学者にとってきっかけとなり、AI をシミュレーションと共に活用し、新たな発見を推進するために役立つでしょう。Summit を支える技術は、PC からサーバーにかけて、また、ワークステーションから広大なクラウド コンピューティング システムにかけて、既にあらゆる場所で科学者の仕事を高速化しています。
ジェンスン フアンはこう述べています。「Summit は新種のコンピューターです。Summit は世界最大の AI スーパーコンピューターであり、学習するマシンでもあります。Summit のソフトウェア自身がソフトウェアを書きます。人間には書けないような、驚くべきソフトウェアが生み出されるでしょう」
AI と HPC の融合
Summit は、AI に向けて作られた新世代マシンと DNA を共有しています。しかし Summit の動作スピードは、他のマシンとは比較にならないレベルになるでしょう。研究者は、半精度もしくは FP16 として知られる簡素化された計算を利用し、Summit のパフォーマンスをおよそ 15 倍高め、エクサスケール (1 秒あたり 100 京回以上の命令数) にまで届かせることができるでしょう。
これは圧倒的な数値です。もしも 1 回の計算が 1 粒の砂だったら、ヒューストンのアストロドーム球場が 1 秒に 350 回埋まることになります。
Summit が科学にもたらす貢献
Summit の提供するスピードにより、現代の科学者は驚くべき事業を達成できるでしょう。オークリッジ国立研究所は以前から最先端科学の活躍場所となっており、同地には、マシンを利用して最高の仕事をしたいと考える、熱意ある科学者たちが集まっています。
そのため、Summit のスケジュールは既に埋まりきっています。以下は、Summit によって加速されるプロジェクトの一例です:
- がん研究: エネルギー省と米国立がん研究所は CANDLE (CANcer Distributed Learning Environment: がん分散学習環境) というプログラムに取り組んでいます。このプログラムの目標は、ヘルス データの自動的な抽出、分析、分類を実行し、遺伝子、バイオ マーカー、環境といった病気因子同士が持っている、以前は不明だった関係性を明らかにすることです。
- 核融合エネルギー: 核融合は、太陽を支えるエネルギーの源です。これは、クリーンで豊富なエネルギーの有望株であると、長年うたわれてきました。Summit は核融合炉と、磁場によって閉じ込められたプラズマとをモデル化し、商業的な開発を促進します。
- 疾病や依存症の研究: 研究者は、人間のたんぱく質/細胞システムの作用と進化にまつわるパターンを割り出すため、AI を活用する予定です。こういったパターンが分かれば、アルツハイマーや心臓病、依存症などへの理解を深めたり、創薬プロセスを活性化したりするのに役立てることができます。
人類が次に経験する飛躍
科学者は、機械学習やディープラーニングといった技術を大々的に用いることで、Summit を舞台とした飛躍的な前進を遂げるでしょう。これによって、経済は後押しされ、医療は向上し、無限エネルギーの提供も支援されます。地球を救う助けとなることすら、あり得るかもしれません。NVIDIA が、より高速なスーパーコンピューターを必要とする理由は、ここにあります。
というわけで、コンピューティングに関する次の大きな課題も、もう設定されています。すなわち、世界初となるエクサスケールのスーパーコンピューターの開発です。NVIDIA は既に全力をあげ、この目標達成を支援しています。成功すれば、世界の科学者と研究者は、研究活動を迅速に行い続けられるでしょう。
フアンは次のように述べています。「『頂上 (Summit)』に到達したオークリッジ国立研究所の友人と仲間たちに、心からの祝意を表します。この地点から、私たち全員は次の山頂を目指して飛躍できるのです」
世界最速のスーパーコンピューターに関する 5 つの事実
- 200 ペタ FLOPS での動作: 地球上の人間全員が 1 秒に 1 回の計算を行うとすると、1 年かけてようやく、Summit の 1 秒分を終わらせることができます。
- 3 エクサ OPS の AI: 地球上の人間全員が 1 秒に 1 回の計算を行うとすると、15 年かけてようやく、Summit の 1 秒分を終わらせることができます。
- Summit の初期テストにおいて、PC なら 30 年かかる問題を、あるゲノム研究チームは 1 時間で解き終えました。
- Summit の筐体スペースは 5,600 平方フィートであり、これはテニス コート 2 面分の大きさに匹敵します。
- Summit の重量は商用ジェット機とほぼ同じです。
Summit のインフォグラフィックはこちらからご覧ください。