GPU がゲノミクス解析を高速化、病気の早期治癒につなげる

投稿者: Rick Merritt

ウイルスに侵された科学者が、回復後すぐに NVIDIA GPU を使って開発を再開

GPU が病気を理解する時間をいかに短縮するかをテーマにオンライン トークを行った数日後、マーガレット リナン (Margaret Linan) 氏は体調を崩し、午前 3 時ごろ激しい息切れを感じて目を覚ましました。

「とても恐ろしい体験でした」と、米ニューヨーク市にあるマウント サイナイ アイカーン医科大学で計算科学研究員を務めるリナン氏は振り返ります。駆け付けた救護者の応急手当の甲斐あって、およそ 20 分後には正常な呼吸を取り戻しました。

症状は数日かけて快方に向かいましたが、しばらくは安定しない不可解な体調が続きました。

「あれは新型コロナウイルスの軽症状だったという確信に近いものがあります」と、自宅待機に身を置いていたリナン氏は言います。

それはリナン氏の研究の価値を改めて認識する強烈な体験となりました。リナン氏は、がんをはじめとする病気の治療法を見つけるために使用される、ヒトゲノムの変異発見を加速するソフトウェアの開発とテストを行っています。

GTC Digital でその最新の研究結果を発表したリナン氏は、複数の GPU と CPU を組み合わせて使用することでゲノミクスが劇的に高速化することを示しました。その解析からわかったのは、GPU でデータ サイエンスを加速する NVIDIA の RAPIDS ソフトウェアによって、現行の主に CPU ベースのプログラムからの移行がいかに容易になるかということです。

ゲノミクスにおける 6 倍の高速化とさらなる探求

CPU でのゲノム サンプルの処理と分析には数か月かかることがあります。がん患者を抱える医師は救命治療のためにそのような研究に頼ることもあります。

リナン氏の実験では、GPU を採用することにより、あるゲノム解析で 6 倍以上の高速化が見られました。また必要な実行回数が多い別のジョブでは、さらに大きな時間短縮を達成しています。

GATK Haplotype Caller の精度に対する 5 回のテスト実行で、10 ~ 40 コアの CPU と NVIDIA GPU を実行するシステム (緑) が CPU だけのシステム (紫) を上回っています。

リナン氏のラボでは、当初 GPU 1 基を搭載したサーバーを使ってテストが行われていましたが、その後実験が進展すると、NVIDIA V100 Tensor コア GPU を 48 基搭載したマウント サイナイの Minerva システム (1 つのジョブに最大 4 基使用可能) で実行されるようになりました。また、8 基の V100 GPU を使った高度なテストは、AWS のクラウドに送信されました。

6 つの GPU ソフトウェア フレームワークの比較では、RAPIDS が支持されました。サポートされている Python プログラムに慣れ親しんだバイオインフォマティクスの専門家にとって、もっとも使いやすかったためです。

「オブジェクトを入力すれば、期待どおりの動作をしてくれます」と、リナン氏は言います。

オープン ソースの GPU コードが登場

マウント サイナイの研究チームは、極めて困難なジョブに Minerva システムやクラウド上の GPU を利用するケースが増えている、とリナン氏は報告しています。

これが、リナン氏が GPU でゲノミクスを加速する一連のオープン ソース プログラムの開発を目指す理由の 1 つです。この分野で主に使用されているツールは 5 つほどありますが、そのうちの 1 つである Genome Analysis Toolkit (GATK) については GPU アクセラレーテッド バージョンの開発がほぼ完了しており、他 2 つも進歩を遂げています。

「年末までには当チームの研究員がテストできるようにベータ バージョンを提供したいと考えています」と、リナン氏は述べています。

ニューヨーク市にあるこの大学病院の研究員の間では、AI の使用例が増えているといいます。

来年末、マウント サイナイは医療における AI 拠点として 1 億ドル規模の研究センターを開設し、AI を利用する既存の Institute for Genomic Health の取り組みを拡大する予定です。

他にも、同医科大学のもう 1 つのプロジェクトである「Deep Patient」では、ニューラルネットワークを使用して、どの患者が糖尿病や特定のがんを発症するリスクがもっとも高いかを予測しています。さらに、マウント サイナイは医療用 AI のスタートアップも 2 つ創設しました。RenalytixAI では腎臓病の臨床診断法の設計を手掛け、Sema4 では AI を使ってパーソナライズされたがん治療プログラムの開発を手掛けています。

「GPU は今後何年にもわたって多くの大規模研究プロジェクトで利用されていくでしょう」と、リナン氏は述べています。