NVIDIA BioNeMo、AWS 上で創薬のための生成 AI を実現

投稿者: Kimberly Powell

製薬会社やハイテクバイオ企業は、BioNeMo を含む NVIDIA Clara ヘルスケア スイートに、Amazon SageMaker と AWS ParallelCluster を介してアクセスできるようになり、AWS 上の NVIDIA DGX Cloud でもまもなく利用可能に

製薬会社やハイテクバイオ企業の研究者や開発者は、Amazon Web Services を通じて、ヘルスケアを加速するための NVIDIA Clara ソフトウェアとサービスを簡単に導入できるようになりました。

AWS re:Invent で発表されたこのイニシアチブは、AWS クラウド リソースを使用するヘルスケアおよびライフ サイエンスの開発者に、NVIDIA が高速化し提供する創薬のための生成 AI プラットフォームである NVIDIA BioNeMo などを統合する柔軟性を与えます。これは、AWS 上の NVIDIA DGX Cloud でまもなく提供される予定であり、現在はハイ パフォーマンス コンピューティング用のクラスター管理ツールの AWS ParallelCluster と機械学習サービス の Amazon SageMaker を通じて利用できます。

AWS は、世界中の何千ものヘルスケアおよびライフ サイエンス企業が利用しています。これらの企業は、BioNeMo にアクセスすることで、AWS 上の NVIDIA GPU アクセラレーテッド クラウド サーバーを使用して、モデルのトレーニングや展開をスケールアップしながら、独自のデータによるデジタル生物学の基盤モデルの構築やカスタマイズができるようになります。

Alchemab Therapeutics、Basecamp Research、Character Biosciences、Evozyne、Etcembly、LabGenius などの テックバイオ イノベーターは、すでに BioNeMo を生成 AI による創薬の開発加速のために利用している AWS ユーザーです。今回の協業により、生体分子データでトレーニングされた生成 AI モデルを開発するためのクラウド コンピューティング リソースを迅速にスケールアップする方法が増えました。

今回の発表は、AWS 上で利用可能な NVIDIA の既存のヘルスケアに特化した製品である医用画像ワークフロー向けの NVIDIA MONAI と、ゲノム解析を加速する NVIDIA Parabricks を拡張するものです。

AWS の新機能 NVIDIA BioNeMo が創薬のための生成 AI を推進

BioNeMo は、デジタル生物学の生成 AI の領域に特化したフレームワークであり、事前トレーニング済みの大規模言語モデル (LLM)、データ ローダー、最適化されたトレーニング レシピを含み、ターゲットの識別、タンパク質構造の予測、薬剤候補のスクリーニングを高速化することで、コンピュータ支援創薬の発展に貢献します。

創薬チームは、独自のデータを使用して BioNeMo でモデルを構築または最適化し、クラウドベースのハイ パフォーマンス コンピューティング クラスターで実行することができます。

これらのモデルの 1 つである ESM-2 (タンパク質の構造予測をサポートする強力な LLM) は、256 基の NVIDIA H100 Tensor コア GPU でほぼリニアなスケーリングを達成しました。研究者は、512 基の H100 GPU に拡張することで、元の論文で発表されたトレーニング時間である 1 ヶ月ではなく、わずか数日でトレーニングを完了できます。

開発者は、6 億 5,000 万または 30 億パラメータのチェックポイントを使用して、ESM-2 を大規模にトレーニングすることができます。BioNeMo トレーニング フレームワークでサポートされるその他の AI モデルには、低分子生成モデル MegaMolBART とタンパク質配列生成モデル ProtT5 があります。

BioNeMo の事前トレーニング済みモデルと最適化されたトレーニング レシピは、AWS ParallelCluster や Amazon ECS のような自己管理型サービスだけでなく、NVIDIA DGX Cloud や Amazon SageMaker による統合管理型サービスでも利用可能であり、研究開発チームがより多くの薬剤候補を探索し、ウェット ラボでの実験を最適化し、有望な臨床候補をより早く発見できる基盤モデルを構築するのに役立ちます。

AWS でも利用可能な医用画像とゲノム解析のための NVIDIA Clara

Project MONAI は、NVIDIA によって共同設立され、NVIDIA エンタープライズにサポートされている医用画像ワークフローをサポートするためのプロジェクトです。これは、180 万回以上ダウンロードされており、AWS 上に展開可能です。開発者は、AWS クラウド リソースに既に保存されている独自のヘルスケア データセットを活用して、迅速にアノテーションを付け、医用画像用の AI モデルを構築することができます。

これらのモデルは、NVIDIA GPU を搭載した Amazon EC2 インスタンス上でトレーニングされ、医用画像におけるセグメンテーション、分類、レジストレーション、検出タスクのためのインタラクティブなアノテーションやファインチューニングに使用することができます。開発者は、MONAI で利用可能な MRI 画像合成モデルを活用して、トレーニング データセットを拡張することもできます。

ゲノム解析のパイプラインを高速化するために、Parabricks はヒトゲノム全体のバリアント コーリングを、CPU のみのシステムでは 1 日かかるところを約 15 分で可能にします。AWS 上では、開発者は複数の GPU ノードで大量のゲノム データを処理するために迅速にスケールアップすることができます。

十数種類の Parabricks ワークフローが Ready2Run ワークフローとして AWS HealthOmics で利用可能であり、顧客は構築済みのパイプラインを簡単に実行することができます。

創薬、ゲノミクス、医用画像のための AI ワークフローを加速するために、NVIDIA Clara on AWS を始めましょう。