科学者たちは、NVIDIA cuQuantum と Xanadu の PennyLane のおかげで、初めてスーパーコンピューティングの規模で量子シミュレーションを加速
ロングアイランドの大西洋岸から 10 マイルの地点で、Shinjae Yoo 氏はエンジンをかけています。
米エネルギー省ブルックヘブン国立研究所の計算科学者で、機械学習グループ リーダーの Yoo 氏は、新しいソフトウェアのおかげで、初めてスーパーコンピューター上で量子コンピューティング シミュレーションを実行する準備をしている多くの研究者の一人です。
Yoo 氏が所属する国立エネルギー研究科学計算センター (NERSC) の Perlmutter スーパーコンピューターでは、トロントを拠点とする Xanadu の量子プログラミング フレームワークである PennyLane の最新バージョンを使用しています。このオープンソース ソフトウェアは、NVIDIA cuQuantum ソフトウェア開発キットをベースにしており、NVIDIA GPU のハイパフォーマンス クラスタ上でシミュレーションを実行することができます。
Yoo 氏のような研究者は、海洋規模のデータセットを処理する必要があるため、パフォーマンスが鍵となります。彼は、量子コンピューターが使用する強力な計算機である約 3 ダースの量子ビットをシミュレーションするために、Perlmutter 上で 256 基もの NVIDIA A100 Tensor コア GPU を使用してプログラムを実行します。
これは、最近のほとんどの研究者がモデル化できる量子ビットの数の約 2 倍です。
パワフルでありながら使いやすい
PennyLane のいわゆるマルチノード バージョンは、NVIDIA cuQuantum SDK と組み合わせて使用され、量子システムの大規模シミュレーションを加速する複雑な作業を簡素化します。
「これで、私のインターンにも最大規模のシミュレーションをさせる道が開けました。だからとても興奮しているのです」と、Yoo 氏は述べました。彼のチームでは PennyLane を使用した 6 つのプロジェクトが進行中です。
彼の研究は、高エネルギー物理学と機械学習の進歩を目指しています。他の研究者は、量子シミュレーションを使って化学や材料科学を新たなレベルに引き上げています。
量子コンピューターは企業の研究開発センターでも活かされています。
例えば、Xanadu は、Rolls-Royce が持続可能な航空機用の最先端のジェット エンジンを設計するための量子アルゴリズムを開発したり、Volkswagen Group が電気自動車のためにより強力なバッテリーを発明したりするのを支援しています。
Perlmutter の 4 つのプロジェクト
一方、NERSC では、量子コンピューティング プログラムを率いる Katherine Klymko 氏によれば、今年、マルチノードの PennyLane を使ったプロジェクトが少なくとも 4 つ進行中だと言います。その中には NASA Ames やアラバマ大学の取り組みも含まれています。
Katherine Klymko 氏は次のように述べています。「私の化学分野の研究者たちは、古典コンピューターでは扱えないほど巨大な分子複合体を研究したいと考えています。Pennylane のようなツールを使うことで、現在古典的にできることを拡張し、最終的には大規模な量子コンピューターでアルゴリズムを実行する準備をすることができます」
AI と量子概念の融合
PennyLane は斬新なアイデアの産物です。バックプロパゲーションのような一般的なディープラーニング テクノロジや、PyTorch のようなツールを量子コンピューターのプログラミングに適応させています。
Xanadu は、できるだけ多くの種類の量子コンピューターで動作するようにコードを設計したため、このソフトウェアは 2018 年の論文で紹介された直後から量子コミュニティーで人気を博しました。
「最先端の研究を身近なものにすることで、私たちのコンテンツへの関心が高まり、人々は興奮しました」と、Xanadu のプロダクト ディレクターであり、量子物理学者で論文の著者でもあり、PennyLane の開発者でもある Josh Izaac 氏は振り返ります。
より多くの量子ビットを求める声
PennyLane のフォーラムで、「もっと量子ビットが欲しい」と最近よくコメントを見ます。PennyLane の性能を担当する Xanadu のシニア量子ソフトウェア開発者である Lee J. O’Riordan 氏は次のように述べています。「2022 年に GPU 1 基で動く cuQuantum で研究を開始したとき、ほぼ全面的に 10 倍のスピードアップを達成しました。私たちは年末までに 1,000 ノード、つまり 4,000 GPU まで拡張したいと考えています」
科学者たちは、このパフォーマンスでどのような問題に取り組むか、つまり、どのような問題が望ましいのか熟考しているところです。
量子コンピューターを設計している企業は、より優れたシステムを構築するためのアイデアをテストするために、この高速化を利用するでしょう。彼らの研究は好循環を生み、PennyLane の新たなソフトウェア機能を実現し、それがさらにシステムの性能を向上させます。
GPU でうまくスケーリングする
O’Riordan 氏は、GPU が PennyLane の性能を拡張するための最良の手段であることを早くから見抜いていました。彼は昨年、量子プログラムを 100 以上の GPU に分割し、60 以上の量子ビットを 30 量子ビットのサブ回路に分割してシミュレーションする方法に関する論文を共同執筆しました。
「NVIDIA が cuQuantum にマルチノード機能を追加すると聞いたとき、私たちはできるだけ早くそれをサポートしたいと思いました」と、O’Riordan 氏は言います。
それから 4 ヶ月でマルチノードの PennyLane が誕生しました。
また、彼は次のように述べています。「大規模な分散 GPU プロジェクトとしては素晴らしい成果でした。cuQuantum で働く全員が、統合を可能な限り容易にする手助けをしてくれました」
Xanadu のブログでは、開発者が PennyLaneと cuQuantum を使って 30 以上の量子ビットを持つ大規模システムをシミュレーションする方法について詳しく説明しています。
チームはまだデータを収集中ですが「サンプルベースのワークロードでは、ほぼリニアなスケーリングが確認されています」と、O’Riordan 氏は言います。
あるいは、NVIDIA の創業者/CEO であるジェンスン フアン (Jensen Huang) の言葉を借りれば「買えば買うほどお得になる」ということです。