HMS ビーグル号は、自然科学者のチャールズ・ダーウィンを乗せて世界を周航し、ダーウィンが進化の過程についての着想を得るきっかけとなりました。それからおよそ 200 年後、もう 1 つのビーグル (BEAGLE) によって、科学者は複雑な遺伝子データに存在する障害を取り除き、生物界をより深く理解し、ひいては生命を救おうとしています。
21 世紀の BEAGLE は、Broad-platform Evolutionary Analysis General Likelihood Evaluator (ブロードプラットフォーム進化解析総合的可能性評価装置) の略語であり、NVIDIA の GPU を利用するオープンソース ライブラリおよび API です。ソフトウェアがデータを処理する速度は、あらゆる生命体の遺伝物質を保持する DNA、また AIDS やインフルエンザ、エボラ出血熱を引き起こすものを含む多数のウィルスなどの生物学的配列データを解析する上で、非常に重要な要素です。
BEAGLE は特定のモデルを高速かつ正確に計算できるため、有機体の進化の歴史を研究する多くの科学者の間で、そのソフトウェア ワークフローに必要不可欠なものとなりました。この分野は系統発生学的推論として知られ、その対象は疫病を誘発するバクテリアから、ミゾホオズキがいかにしてさまざまな地理的地域に適応してきたかについての研究まで、多岐にわたります。
メリーランド大学先端コンピューター研究所 (University of Maryland’s Institute for Advanced Studies) 教授のマイケル カミングス (Michael Cummings) 氏と、ソフトウェア設計およびプログラミングを担当した同僚のダニエル アイレス (Daniel Ayres) 氏が、BEAGLE の開発を主導しました。
この取り組みによって、BEAGLE 開発チームは 2017 年の NVIDIA グローバル インパクト アワードの最終候補 5 組の 1 つに選ばれました。NVIDIA は毎年、社会的な問題、人道的な問題、環境問題に対処するための革新的な研究を NVIDIA の技術を利用して行った研究者に、賞金 15 万ドルを授与しています。
コンピューターが追いつく
カミングス氏が系統発生解析に GPU を活用することを思いついたのは、2003 年のことでした。しかし当時の開発フレームワークは初期段階にあり、十分な性能がありませんでした。2007 年、高性能演算 GPU である NVIDIA の CUDA が登場し、さらにアメリカ国立科学財団の資金提供を受けて、BEAGLE が実現したのです。
系統発生学的推論で使用される巨大かつ演算上の要求が多いデータセットの処理は、なかなかはかどらず、行き詰まることも多いものです。迅速に結果を生み出す能力により、研究者が公衆衛生当局に協力し、公衆衛生上の脅威に対応できる可能性が高まっています。
系統発生学的関係は、多様な生物学的種の間の、推定される進化上の関係を表します。ダーウィンが、さまざまな島に生息するフィンチの亜種間に関連性を見いだそうとしたことを考えてみてください。同じように、研究者は BEAGLE を利用して、一見無関係に思われるような有機体の進化動態を把握しようとしているのです。
強力な性能
今では、BEAGLE の強力な GPU 性能を活用して、科学者はより複雑なモデルやより大規模なデータセットを使用できるようになりました。これにより、推論の質は向上し、所要時間は短縮されています。
「BEAGLE は、インフルエンザやエボラ出血熱の進化の歴史を推論するために利用されています。このおかげで、発生が地理的にどの地点で、またどの時点で起こったかについて、科学者が判断を試みることができるようになりました」とカミングス氏は述べています。
BEAGLE のライブラリは、系統発生解析用のパブリック リソースである、CIPRES Science Gateway ポータルの一部です。演算インフラストラクチャには、NVIDIA Tesla K20 カードを搭載した計算クラスタが含まれています。
チームの最新の取り組みである CUDA プラットフォームでは、Tesla K40 と Quadro P5000 カードを使用しています。これらは、これまでにない演算手法を実装する際、多数の処理コアを結びつけ、効率的に演算を並列処理します。
病気の発生
進化生物学で最も幅広く使用されているプログラムの中には BEAGLE のライブラリを採用しているものもあり、HIV、デング熱、口蹄疫など、ヒトの疾患を引き起こすその他のウィルスに取り組む何千人もの科学者が利用できるようになっています。
研究の中には、ブラジルにおけるデング ウィルスの飛行機での移動による伝播、ナイジェリアにおけるポリオウィルスの複数の発現、さらには胃腸炎を引き起こす薬物耐性菌の世界的なまん延などがあります。
動物に関する BEAGLE の活用例としては、北米における豚インフルエンザ ウィルスの特性評価、朝鮮半島における水鳥の渡りとインフルエンザとの関係、アルゼンチンにおいて吸血コウモリが媒介する狂犬病の動態などの研究が挙げられます。
「BEAGLE は進化と生物学のより深い理解につながる、さまざまな研究に利用されています。これは、意思決定に役立つ情報提供の役割を担うものです。GPU によって実現した性能は、特に疫学に直結します。疫学では、急速に広がる病原体の性質を特定する必要が生じる場合があるのです」とアイレス氏は述べています。
カミングス氏とアイレス氏は現在、NVIDIA の強力な Pascal と、間もなくお目見えする Volta プロセッサ アーキテクチャをもっと活用して、さらなる性能向上を目指すことに注力しています。BEAGLE プロジェクトは、科学者のコミュニティの恩恵を受けました。その中には、カリフォルニア大学ロサンゼルス校 (UCLA) の教授であるマーク スチャード (Marc Suchard) 氏と、エジンバラ大学 (University of Edinburgh) の教授であるアンドリュー ランボー (Andrew Rambaut) 氏がおり、開発に貢献しました。
2017 年のグローバル インパクト アワードの受賞者は、5 月 8 ~ 11日にシリコンバレーで開催される GPU テクノロジ カンファレンスで発表されます。カンファレンスへの登録は、GTC 登録ページで行うことができます。
NVIDIA の2017 年グローバル インパクト アワードの最終候補者には、他にインド工科大学グアハティ校があります。
昨年のグローバル インパクト アワード受賞者もご覧ください。
AI Podcast: ディープラーニングで、一度は絶滅したはずの鳥の鳴き声を聞く
テクノロジと生物学との関わりにご興味があれば、NVIDIA の AI Podcast に耳を傾けてみてください。Conservation Metrics の CEO であるマシュー・マッカウン (Matthew McKown) 氏と対談し、ディープラーニングがいかにして、一度は絶滅したと考えられていた鳥の再発見に一役買ったか、また GPU を搭載した AI によって、膨大な量のデータをどのように高速処理し、これまでは検出が不可能だった傾向を特定できるようになったかについて、お話を伺っています。