『Nature Medicine』に掲載された結果によると、フェデレーテッド ラーニングにより医療機関をまたいで一般化する強力な AI モデルを構築できることが示されており、将来的にエネルギー、金融サービス、製造などの分野に応用が広がる見込み
COVID-19 による危機をきっかけとした、複数の病院による取り組みによって明らかになったことがあります。それは、どのような業界の機関であっても連携することで、精度と一般化可能性の両方に新しい基準を打ち立てる予測 AI モデルを開発できるということです。
査読付き大手医学誌である『Nature Medicine』で今月発表されたコラボレーションは、機密データや少量なデータによる制約がある業界でも、プライバシーを保護するフェデレーテッド ラーニング技術によって、組織の垣根を越えて機能する堅牢な AI モデルの構築が可能であることを示しています。
Mass General Brigham で AI 開発を主導し、ヘルスケアのスタートアップ企業 Rhino Health を今年設立した、この研究の筆頭著者のイッタイ ダヤン博士 (Dr. Ittai Dayan) は次のように述べています。「AI 開発では通常、ある病院のデータに基づいてアルゴリズムを作成しても、他の病院ではうまく機能しません。
しかし、フェデレーテッド ラーニングと、さまざまな大陸から集めた客観的なマルチモーダル データを使用してモデルを開発することで、一般化可能なモデルを構築することができ、最前線で働く世界中の医師に役立ててもらえるようになります。」
他にも、5 人のメンバーによるマンモグラフィー評価の研究や、脾臓のセグメンテーションに使用する AI モデルをトレーニングする製薬大手のBayerの研究など、大規模なフェデレーテッド ラーニング プロジェクトがヘルスケア業界ですでに進行中です。
ヘルスケアだけでなく、フェデレーテッド ラーニングによってエネルギー会社は地震や坑井のデータの分析が可能になり、金融会社は不正検出モデルを改善でき、自動運転車の研究者はさまざまな国の運転行動を一般化する AI の開発が可能になります。
フェデレーテッド ラーニング:さまざまな人が AI を育てる
AI モデルを開発している企業や研究機関は通常、利用可能なデータに制限があります。これは、小規模な組織やニッチな研究分野では、正確な予測モデルをトレーニングするのに十分なデータが不足しているということでもあります。大規模なデータセットでさえ、組織の患者や顧客層、特有のデータ記録方法、または使用する科学機器のブランドによっても偏りが生まれる可能性があります。
堅牢で一般化可能なモデルが作成できるほどのトレーニング データを収集するには、ほとんどの企業は同業者とデータを共有する必要があります。ただし多くの場合、データ プライバシー規制により、患者の医療記録や独自のデータ セットなどのデータを、一般に利用されているスーパーコンピューターやクラウド サーバーで直接共有することは制限されています。
そこで、フェデレーテッド ラーニングの出番です。
Mass General Brigham と NVIDIA が主導し、EXAM (EMR CXR AI Model) と名付けられた、今回の『Nature Medicine』に掲載された新しい研究では、5 大陸の 20 の病院が共同で参加し、COVID-19 の患者が救急科などの診療現場に到着してから 24 時間と 72 時間後に必要となる酸素補給レベルを予測するニューラルネットワークをトレーニングしました。これは、これまでの臨床現場でのフェデレーテッド ラーニング研究において最大かつ最も多様性に富んだ研究の 1 つです。
多くの手が AI を機能させる
フェデレーテッド ラーニングにより、EXAM に参加した病院では、各拠点のプライベート サーバーに格納されているプライベート データを見なくても、参加しているすべての病院の胸部 X 線画像、患者のバイタル、患者の統計データ、ラボの値から学習する AI モデルを開発できました。
参加した病院ではそれぞれ、ローカルの NVIDIA GPU で同じニューラルネットワークのコピーをトレーニングしました。トレーニング中、各病院は定期的に更新されたモデルの重みのみを中央サーバーに送信し、そこでニューラルネットワークのグローバル バージョンがそれらを集約して新しいグローバル モデルを作り出しました。
これは、解答を導き出すために使用した学習参考資料を公開せずに、試験の解答集を共有するようなものです。
NIH のインターベンショナル オンコロジー センターのディレクターで、NIH クリニカル センターのインターベンショナル ラジオロジー部門のチーフも務める、この研究の共著者のブラッド ウッド博士 (Dr. Brad Wood, director of the NIH Center for Interventional Oncology and Chief of Interventional Radiology at the NIH Clinical Center) は次のように述べています。「EXAM イニシアチブの成果は、ヘルスケアの現場において、個人を特定できるデータをやりとりすることなく、高性能で一般化可能な AI モデルのトレーニングが可能であることを示しています。データ プライバシーを守ることができます。
今回の調査結果は、COVID-19 の予測において参加した病院間のモデル以外にも十分影響力を持つものであり、フェデレーテッド ラーニングが一般的な分野の有望なソリューションとなることを示しています。この調査により、医療における AI ディープラーニングの可能性を実現する上でも求められる可能性のある、効果や適合性がより高いビッグデータ共有に向けたフレームワークがもたらされます。」
このグローバル EXAM モデルは参加しているすべての現場で共有され、このモデルにより AI モデルの平均パフォーマンスが 16% 向上しました。研究者は、1 か所の現場でトレーニングされたモデルと比較した場合、一般化可能性が平均 38% 向上することを確認しました。
上のグラフに示されているように、データ セットが小さい病院ではパフォーマンスが特に劇的に向上しています。
タイのチュラロンコン大学および、EXAM に協力した 20 病院の 1 つであるキング チュラロンコン記念病院の医学用 AI センターで共同ディレクターを務めるシラ シサワスディ氏 (Sira Sriswasdi, co-director of the Center for AI in Medicine at Chulalongkorn University and King Chulalongkorn Memorial Hospital) は、次のように述べています。「フェデレーテッド ラーニングにより、あらゆる人のデータから学習し、あらゆる人が利用できるよう一般化されたモデルを開発するという共通の目的に向かって、世界中の研究者がコラボレーションできます。NVIDIA GPU と NVIDIA Clara ソフトウェアを使用した結果、この調査に簡単なプロセスで参加することができ、有用性の高い結果が得られました。」
病院やスタートアップ企業が EXAM の調査をさらに進める
北米、南米、ヨーロッパ、アジアから参加病院が集まった当初の EXAM 研究では、医師が患者に必要な治療レベルの判断の根拠となる患者の酸素需要について、高品質な予測を得るために必要なトレーニング期間はわずか 2 週間でした。
その後、参加病院では AI モデルが一般化され、モデルの構築とトレーニングに貢献した現場から独立した環境でもうまく機能できるかを検証しました。そこでマサチューセッツ州にある 3 つの病院 (Cooley Dickinson Hospital, Martha’s Vineyard Hospital and Nantucket Cottage Hospital) が新たに参加して EXAM をテストし、ニューラルネットワークが独立した目に見えないデータでも問題なく機能することを発見しました。
Cooley Dickinson Hospitalでは、モデルが、患者が救急治療室に到着してから 24 時間以内に、感度 95%、特異度 88% 以上という割合で人工呼吸器の必要性を予測するという結果が得られました。同様の結果は、イギリスのケンブリッジ大学アデンブルックス病院 (Addenbrookes Hospital) でも確認されました。
EXAM のオリジナル モデルの開発に携わった、MGH & BWH 臨床データ サイエンス センターの科学ディレクターであるリ チュアンジャン博士 (Dr. Quanzheng Li, scientific director of the MGH & BWH Center for Clinical Data Science) によると、Mass General Brigham は近い将来 EXAM を導入予定です。レーヘイ ホスピタル & メディカル センター(Lahey Hospital & Medical Center) とイギリスの NIHR ケンブリッジ バイオメディカル リサーチ センター (NIHR Cambridge Biomedical Research Center) と共に、Mass General Brigham ネットワークはNVIDIA Inception のスタートアップである Rhino Health と連携して、EXAM を使用した前向き研究を実施しています。
EXAM のオリジナル モデルは、過去の COVID-19 患者の記録を使用して遡及的にトレーニングされたため、研究者は、患者が最終的に必要とする酸素の量に関する正解データをすでに持っていました。今回の前向き研究では逆に、病院に来る新規の患者から得られるデータに AI モデルを適用するものであり、実際の環境での導入に向けてさらに一歩前進することになります。
ケンブリッジ大学医学部の放射線科長であるフィオナ ギルバート氏 (Fiona Gilbert, chair of radiology at the University of Cambridge School of Medicine) は、次のように述べています。「フェデレーテッド ラーニングには、AI イノベーションを臨床ワークフローにもたらす変革力があります。EXAM に今後も取り組む目的は、この種のグローバルなコラボレーションを 1 回限りのものとせず効率を向上させ、が健康上の複雑な課題や将来の感染症流行に対処する臨床医のニーズに応えられるようになることです。」
EXAM モデルは、 NVIDIA NGC ソフトウェア ハブを介して研究用に一般公開されています。フェデレーテッド ラーニングをこれから利用する企業や研究機関は、NVIDIA-Certified Systems(NVIDIA 認証システム)上で実行するために最適化された AI ツールとフレームワークの NVIDIA AI Enterprise ソフトウェア スイートを利用できます。
こちらの論文では、フェデレーテッド ラーニングの背後にある科学について詳しく説明されています。また、NVIDIA Clara AI プラットフォームを使用したフェデレーテッド ラーニングの概要については、こちらのホワイトペーパーをお読みください。
NVIDIA ヘルスケア ニュースの購読はこちらからお申込みください。