COVID-19 の治療に向けたスクリーニング: 日本のスタートアップが創薬に AI を活用

投稿者: Isha Salian

研究者たちは COVID-19 の治療に適した薬物分子の発見を急いでいます。しかし存在しうる薬物類似分子の数は想像もつかないほど多く、その数は 10 の 60 乗と見積もられています

東京に拠点を置くスタートアップ企業の株式会社 Elix の共同創業者兼 CEO である結城 伸哉 (ゆうき しんや) 氏は次のように述べています。「仮に毎秒 1 つの分子を調べられたとしても、ケミカル スペース全体を探索するには宇宙の年齢よりも長い年月がかかります。AI なら巨大な探索空間を効率的に探索でき、創薬や材料開発、あるいは囲碁のようなゲームなど、さまざまな難しい問題を解くことができます」

結城氏の会社は創薬を加速するためにディープラーニングを使用しており、コンピューター シミュレーションよりもはるかに速く分子の性質を予測できるニューラルネットワークを構築しています。COVID-19 の研究を支援するため、Elix のチームは AI を使用して、FDA 承認済みの薬や臨床試験中の薬の中で新型コロナウイルスの治療に転用できそうなものを探しています。

「新薬を一から開発するプロセスには何年もかかりますが、特にこのパンデミックの状況においてそれは望ましくありません。スピードが何よりも重要であり、ドラッグ リポジショニング (既存薬再開発) ならば、すでに臨床的な安全性が記録されている薬から候補を特定し、薬の開発にかかる時間とコストを大幅に削減できます」

Elix は先日、同社の AI モデルが COVID-19 の治療薬になりうると判断した承認薬および臨床試験段階の薬について論文を発表しました。Elix の AI ツールが候補として選んだものの中には、5 月に FDA から新型コロナウイルスの症例に対する緊急使用許可を受けた抗ウイルス薬のレムデシビルも含まれていました。

Elix は、スタートアップの迅速な市場参入を支援するプログラムである NVIDIA Inception のメンバーであり、ディープラーニング アルゴリズムの学習と推論に NVIDIA DGX Station を使用しています。結城氏は、開発者や AI 研究者向けの NVIDIA のデジタル カンファレンス、GTC DigitalInception スタートアップ ショーケースで、Elix の AI による創薬の取り組みについて発表しました。

創薬のための Elix の AI 修正

分子レベルで見ると、成功する薬は、標的とするタンパク質、たとえば SARS-CoV-2 (COVID-19 を引き起こすウイルス) のエンベロープを覆うスパイク タンパク質などと結合するための完璧な形状、柔軟性、相互作用エネルギーの組み合わせを持っていなければなりません。

SARS-CoV-2 (COVID-19 を引き起こすウイルス) は、表面がタンパク質のスパイクで覆われています。
画像提供: CDC/ Alissa Eckert, MSMI、Dan Higgins, MAMS。パブリック ドメインに基づきライセンス許諾。

これらのスパイク タンパク質が体内の細胞に付着し、細胞の中にウイルスを持ち込むと、人は COVID-19 に感染します。効果的な抗ウイルス薬はこの付着プロセスを妨害できるかもしれません。たとえば、有望な薬物分子はスパイク タンパク質と結合して、ウイルスが人間の細胞に付着するのを防ぐと考えられます。

そのための最適な薬を研究者が見つけられるように、Elix はさまざまなニューラルネットワークを使って候補となる分子の範囲を素早く絞り込みます。これにより研究者は、問題を解決する見込みがより高い、より限定された範囲の分子のために、研究室での物理的なリソースを集中させることが出来ます。

予測 AI モデルを用いて、結城氏のチームはデータベース化された薬剤候補を分析し、特定の疾患の治療に適した物理的、化学的性質を持つ薬剤を推論できます。また、自然界では見られないような有望な分子構造を一から考え出すために、生成モデルも使用しています。

そこで登場するのが 3 つ目のニューラルネットワークである逆合成モデルです。これは、生成された分子が研究室で合成可能かどうかを研究者が判断するのを支援します。

Elix は複数の NVIDIA DGX Station システム (データ サイエンス開発チーム向けの GPU 搭載 AI ワークステーション) を使用してこれらのニューラルネットワークの学習と推論を高速化しており、1 基の GPUで学習する場合 CPU と比べて最大 6 倍の高速化を実現しています。

結城氏によると、生成モデルには高速化が不可欠であり、もし高速化しなければ学習が収束する (ニューラルネットワークのエラー率が可能なかぎり最小になる) まで 1 週間以上かかるといいます。各 DGX Station には 4 基の NVIDIA V100 Tensor コア GPU が搭載されており、これによって Elix のチームはより大きな AI モデルに取り組んだり、一度に複数の実験を実行したりすることができます。

結城氏は次のように述べています。「DGX Station は基本的にスーパーコンピューターです。当社ではたいてい数人のユーザーが同じマシンを同時に使って作業していますが、モデルをより速く学習できるだけでなく、実験を 15 個まで並列で実行できるのです」

Elix は、製薬企業、研究機関、大学などを顧客にしています。製薬業界にとって分子データは機密性の高い知的財産であるため、ほとんどの企業が AI モデルを自社のオンプレミス サーバーで実行することを選びます。

創薬の他に、Elix はタイヤおよびゴム メーカーのブリヂストンや日本最大の研究機関である理化学研究所などと協業し、AI を使ってマテリアルズ インフォマティクスのための分子設計も行っています。さらに、自動運転やエッジ AI 向けのコンピューター ビジョン モデルも開発しています。

あるプロジェクトでは、結城氏のチームは世界的な化学企業である日本触媒と協業し、インクに配合する材料として使える一方で皮膚刺激性のリスクが低い分子を生成しました。

Elix についての詳細は、結城氏の GTC Digital での講演をご覧ください。他のスタートアップが AI やアクセラレーテッド コンピューティングを使用してどのようにパンデミックと戦っているかについては、NVIDIA の COVID ページをご覧ください。

メイン画像提供: Chaos、CC BY-SA 3.0 に基づき Wikimedia Commons によってライセンス許諾。