ラボコンフィデンシャル: 日本の研究が医療データを安全に保つ

三井物産株式会社（以下「三井物産」）の子会社は、NVIDIA GPU を利用した安全なデータ共有によって強力なモデルを構築し、創薬の加速を目指しています。

77 年前に設立された三井物産は、生成 AI やコンフィデンシャルコンピューティングのような新しいテクノロジを利用してビジネスやエコシステムを構築することで、活力を維持しています。

東京を本拠地とした 16 の部門からなるこのコングロマリットにおけるデジタルトランスフォーメーションはさまざまな形態をとっています。あるケースではそれは自律走行トラックサービスであり、別のケースでは地理空間分析プラットフォームです。三井物産は、量子コンピューティングの最先端を行くパートナーとも提携しています。

その新しい子会社の 1 つである株式会社ゼウレカ（以下「ゼウレカ」）は、医療分野の研究開発の加速を目指しています。創薬には、10 億ドル以上の費用と 10 年以上の歳月がかかることもあるためです。

三井物産のデジタルトランスフォーメーショングループのプロジェクトマネージャーである伊藤克哉氏は次のように述べています。「私たちは AI やコンフィデンシャルコンピューティングといった新しいデジタルテクノロジを活用したビジネスを創出しています。私たちの仕事のほとんどは、テクノロジ企業と協業して行われています。今回は、NVIDIA と Fortanix (サンフランシスコに拠点を置くセキュリティソフトウェア企業) です」

ビッグデータの追求

ゼウレカは設立からわずか 3 年ですが、すでに、創薬における最大の問題の 1 つである “十分なデータの収集” に対処する概念実証を完了しています。

創薬を加速するには、ほとんどの製薬会社が保有する以上の大規模なデータセットで構築された強力な AI モデルが必要です。データには患者の個人情報や製薬会社独自の化学式が含まれることが多いため、これまで、企業間でのモデルの共有は考えられませんでした。

そこで登場したのが、コンフィデンシャルコンピューティングです。これは、GPU や CPU の保護された領域でデータを処理する方法であり、企業の最も重要な機密事項を守るブラックボックスのように機能します。

こうしたデータの機密性を常に確保するために、世界有数の企業からなるコンソーシアムが支援するこのテクノロジを、銀行、政府機関、そして広告業者までもが利用しています。

プライバシーの概念実証

コンフィデンシャルコンピューティングにより、顧客が安全にデータを共有できることを検証するため、ゼウレカはそれぞれ 1,000 種類の薬剤候補を持つ 2 つの架空企業を作りました。各企業のデータセットは、化学物質の毒性レベルを予測する AI モデルのトレーニングに別々に使用されました。その後、それらのデータは結合されて、同様のより大規模な AI モデルのトレーニングに使用されました。

ゼウレカは、コンフィデンシャルコンピューティングをサポートするスタートアップ企業の中でも初期から存在する Fortanix のセキュリティ管理ソフトウェアを使用して、NVIDIA H100 Tensor コア GPU 上でこのテストを行いました。

H100 GPU は、GPU 上で使用中のコンフィデンシャルワークロードがパフォーマンスを損なうことなく保護されることを保証および検証するハードウェアベースのエンジンを使用して、信頼できる実行環境をサポートしています。Fortanix ソフトウェアは、データ共有、暗号鍵、および全体的なワークフローを管理します。

最大 74% の精度の向上

結果は目覚ましいものでした。より大規模なモデルの予測は、結合されたデータセットを使用したことにより、65 ～ 74% 精度が向上しました。

単一の企業データで作成されたモデルには不安定さと偏りが見られましたが、大規模なモデルではそのようなことは見られなかったと伊藤氏は述べています。

「Fortanix と NVIDIA のコンフィデンシャルコンピューティングは、これらのプライバシーとセキュリティの懸念を解消しながら、モデルの精度を向上させるため、業界全体にとってウィンウィンの状況を作り出すでしょう」と、Fortanix のプレスリリースで、ゼウレカの CTO である牧口大旭氏は述べています。

AI スーパーコンピューティングエコシステム

現在、ゼウレカは、GPU で高速化される AI スーパーコンピューター、Tokyo-1 のコミュニティと連携し、このテクノロジの創薬研究への幅広い用途を模索しています。2 月に発表されたように、Tokyo-1 は日本国内および国外の製薬会社の効率を向上させることを目的としています。

初期段階のプロジェクトには、信頼性の高いサービスによる、タンパク質構造の予測、大規模なリガンドのスクリーニング、分子動力学シミュレーションの高速化のための共同研究が含まれる可能性があります。Tokyo-1 ユーザーは、NVIDIA BioNeMo 創薬マイクロサービスおよびフレームワークを通じて、化合物、タンパク質、DNA、および RNA のデータ形式の大規模言語モデルを利用できます。

これは、米国、中国に次いで世界第 3 位の 1,000 億ドル規模の日本の製薬業界を活性化するなど、ヘルスケア向けのソフトウェアやサービスを開発することを目指す、三井物産のより広範な戦略的成長計画の一部です。

ゼウレカのサービスには、AI を利用した数十億の薬剤候補の迅速なスクリーニング、いかに有用な分子がタンパク質と結合するかについての予測、詳細な化学的挙動のシミュレーションなどがあります。

詳しくは、NVIDIA コンフィデンシャルコンピューティングおよび創薬向けの AI プラットフォームである NVIDIA BioNeMo をご覧ください。

三井物産株式会社（以下「三井物産」）の子会社は、NVIDIA GPU を利用した安全なデータ共有によって強力なモデルを構築し、創薬の加速を目指しています。

ビッグ データの追求

プライバシーの概念実証

最大 74% の精度の向上

AI スーパーコンピューティング エコシステム

ビッグデータの追求

AI スーパーコンピューティングエコシステム