医療機関が AIによるNVIDIA Clara Federated Learning を使用したマンモグラフィー評価の改善に協力

投稿者: Mona Flores

フェデレーテッド ラーニングのコラボレーションにて、米国放射線科医学会、Diagnosticos da America、Partners HealthCare、オハイオ州立大学、Stanford Medicine が乳房組織密度を評価する優れた予測モデルを開発

病院と医用画像センターから成る国際的なグループは最近、NVIDIA Clara Federated Learning ソフトウェアを評価し、フェデレーテッド ラーニング手法でトレーニングをしたマンモグラフィー評価用の AI モデルが、単一機関のデータでトレーニングをしたニューラルネットワークよりも優れていることが判明しました。

ディープラーニング モデルは、高い精度を実現するためには大規模で多様性に富んだデータセットを必要とします。多くの場合、開発者はさまざまなソースからデータを収集しますがが、ほとんどの場合、医療データの集中型ホスティングは患者データのプライバシー ポリシーにより実現できません。

フェデレーテッド ラーニングはこの課題に対処し、さまざまな機関が機密性の高い臨床データを互いに共有せずに AI モデルを共同開発することを可能にします。特定の放射線科の患者の人口統計や画像機器に偏ったAI ではなく、あらゆるデータセットに対して十分に機能する、より一般化可能なモデルを実現することが目標です。

このプロジェクトの協力者である Partners HealthCare のジャヤシュリー カルパシー クレーマー (Jayashree Kalpathy-Cramer) 氏は、次のように述べています。「フェデレーテッド ラーニングは、患者の記録に対するデータ セキュリティーを損なわずに、世界中の医療機関が協働できる機会を提供します。この方法で、私たちは共同して医学の分野における AI ツールの水準を引き上げることが可能です。」

米国放射線科医学会、ブラジルの画像センターである Diagnosticos da America、Partners HealthCare、オハイオ州立大学、および Stanford Medicine の研究者達が、フェデレーテッド ラーニングのコンセプトを実証するために団結しました。彼らは 6 週間足らずで、各機関がフェデレーテッド ラーニングを使用して 2D マンモグラフィーの分類モデルを改善し、ローカル データのみでトレーニングをしたオリジナルのニューラルネットワークよりも、ローカル データセットでより優れた予測力を達成しました。

モデルのパフォーマンスを高めることによって、フェデレーテッド ラーニングはマンモグラフィーでの乳房組織密度の分類を向上させ、乳がんのリスク評価向上に繋がりました。

リスクの認識

放射線科医がマンモグラフィーを分析する時は、腫瘍を探すだけではなく、女性のマンモグラフィーに写る線維性および腺性の組織の指標である乳房組織密度も評価します。評価結果は、脂肪性、乳腺散在、不均一高濃度、高濃度の 4 種類のうちの 1 つに分類されます。

マンモグラフィーの標準的なスクリーニングで腫瘍が見つからなくても、医師は患者に乳房組織密度の評価を報告する必要があります。これは、40 歳から 74 歳のアメリカ人女性のおおよそ半数が高濃度乳房であり、乳がんを発症するリスクが 4 倍から 5 倍高いためです。

マンモグラフィーから乳房組織密度を分類する高品質のツールによって、患者のがんのリスクをより適切に評価するのに役立つ可能性があります。

この概念実証に使用されたオリジナルのマンモグラフィー分類モデルは Partners HealthCare が提供したもので、NVIDIA GPU上 で NVIDIA Clara Train SDK を使用して開発されました。その後、現場間でデータを転送することなく、各現場で Clara Federated Learning SDK を使用してモデルを再トレーニングしました。

米国放射線科医学会の最高情報責任者であるマイク ティルキン (Mike Tilkin) 氏は、次のように述べています。「ディープラーニング モデルは性質上、トレーニング用データセットのサイズや多様性によって制約を受けます。Clara Federated Learning ソフトウェアは、患者データを共有せずに乳房組織密度の分類モデルの性能を向上させるには極めて重要でした。」
尚、ティルキン氏のチームは、NVIDIA V100 Tensor コア GPU で自身ののモデルを開発しました。

フェデレーテッド ラーニングを推進

参加した 5 つの組織がそれぞれ、このプロジェクトに2D マンモグラフィーのデータセットを提供しました。すべてを合わせると、トレーニングに利用できるスキャン画像は 100,000 枚近くになりました。

これらのスキャン画像を一カ所に集めるのではなく、各機関がデータのためにセキュアな組織内サーバーを設置しました。単一の集中型サーバーにグローバルなディープ ニューラルネットワークが格納されており、参加している各放射線科が自科のデータセットでトレーニングをするためにコピーを取得しました。

所定の件数のトレーニング データを実行した後、各クライアントは一部のモデルの重みをフェデレーテッド サーバーに自動的に送り返します。サーバーはこれらの一部の重みを統合して、アップデートした重みを各クライアントに送信します。

この重み交換を複数回繰り返した後、各参加クライアントの現場では、自組織以外のデータを一度も目にすることなく、参加する 5 つの全機関の集合データセットからの学習情報を使い、より優れたパフォーマンスのモデルを完成させました。

このパフォーマンスの向上は、各機関のローカル データセットに限定されたものではなく、モデルが他の参加組織の現場からのデータでテストされた際にも存続していました。このように、クライアントのデータ センターから臨床情報を移動させることなく、各機関は他の参加組織が独自のデータセットで同じモデルをトレーニングすることの恩恵を受けました。

オハイオ州の放射線学科長を務めるリチャード ホワイト (Richard White) 氏は、次のように述べています。「フェデレーテッド ラーニングを使用して AI モデルのパフォーマンスが飛躍的に向上しました。この暫定的な結果は、分散されたデータでのトレーニングが自動分類モデルに新しい基準を設定できることを示す有望な指標です。」

オハイオ州立大学の研究者は、AI モデルのトレーニングと推論に NVIDIA DGX-1 サーバーを使用しました。

NVIDIA Clara Federated Learning を使用したその他の研究には、あらゆるデータセットで高精度を実現する一般化可能なモデル開発の取り組みの他、セグメンテーション モデルにフェデレーテッド ラーニングを適用するプロジェクトも含まれています。

NVIDIA Clara を始めるには、最新の Clara Train SDK をダウンロードしてください。

画像提供:ビル ブランソン (Bill Branson)、パブリック ドメインに基づき米国国立がん研究所から使用許諾を取得