顕微鏡の下で: 一流の病理学研究チームがデータソースを統合することでがんを検出する AI を開発

GTC DC で、ハーバード大学メディカルスクールとブリガムアンドウィメンズ病院の研究者が、ゲノムおよび医療記録データを用いてがんの診断を向上させる方法を発表。

最近の調査によると、生検標本を使って乳がんを診断する場合、病理専門医の解釈が一致する率は、わずか 75% にとどまっています。

生体組織のスライドを分析するプロセスは難しく、時間がかかるため、どのような病院でも、病理部が最もコストの高い部門の 1 つとなっています。

ハーバード大学メディカルスクールとブリガムアンドウィメンズ病院に勤務する病理学助教授のファイサルマフムード (Faisal Mahmood) 氏は、デジタルホールスライドの病理組織学データ、分子情報、ゲノミクスなどのさまざまなソースを組み合わせてディープラーニングツールを開発するチームを率いています。これによって病理専門医を支援し、がん診断の精度を高めることが目的です。

ブリガムアンドウィメンズ病院の計算病理部にある有名なマフムードラボで所長を務めるマフムード氏は、GTC DC で、本研究についての講演を行いました。GTC DC は、NVIDIA の GPU Technology Conference のワシントン DC 版です。

病理専門医の診断にばらつきがあると、「悲惨な結果になる恐れがあります。なぜなら、診断があいまいだと、さらに多くの生検や不要な侵襲処置が行われる場合もあるからです」と、マフムード氏は最近のインタビューで答えています。「ディープラーニングによって診断と治療反応予測を支援することで、主観による偏りを減らせる可能性があります。」

がんの種類と病理専門医の経験レベルにもよりますが、生検スライドを分析するのに 15 分以上かかる場合もあります。患者 1 人で数十枚のスライドがあるケースでは、必要な時間もふくれ上がります。

また治療計画を決める医師は、患者と家族の病歴、さらに入手可能な場合は分子データやゲノムデータといった他のデータソースも考慮に入れる必要があります。

マフムード氏のチームは、オンプレミスとクラウドで NVIDIA の GPU を用いることにより、これらすべてのデータソースを統合した病理画像解析用の AI ツールを開発しています。

マフムード氏は次のように述べています。「私たちは、ホールスライド画像を処理し、多様なデータソースを統合することで、アルゴリズムの観点から臨床ワークフローにますます近づいています。こうした多様なデータを用いる AI 支援の病理診断ツールにより、前向き研究を行うことも可能になるでしょう。」

AI で全体像を見る

組織生検時に撮影されるデジタル化されたホールスライド画像はサイズが非常に大きく、1 枚が 10 万×10 万ピクセル以上になる場合もあります。ディープラーニングの開発者がこれほど大きなファイルを効率的に計算する場合は、ニューラルネットワークでの処理をより簡単にするためにスライドを個々のパッチに分割することが多いです。しかし、この手法では、トレーニングデータに手動でラベルを付ける必要があるため、研究者にとって非常に時間がかかることになります。

マフムードラボは、データ効率の良い方法で組織のホールスライドを一度に解析する、ディープラーニングモデルを開発しています。具体的には、NVIDIA の GPU を用いることで、ニューラルネットワークのトレーニングと推論を高速化します。これらのモデルは、患者の選定および精密医療のための治療グループ用に層別化するために使用できます。

チームは、ディープラーニングモデルのプロトタイプ作成と推論のために、NVIDIA GPU クラスタを備えた 4 台のオンプレミスマシンを使用しています。研究者は、サイズの大きい病理画像を使ってグラフ畳み込みネットワークと対照的予測符号化モデルをトレーニングするために、Google Cloud で NVIDIA V100 Tensor コア GPU を使っています。

マフムードラボの研究者であるマックスルー (Max Lu) 氏は、次のように述べています。「最新の GPU のおかげで、ホールスライドのディープラーニングモデルのトレーニングが可能になりました。利点は、現在の臨床ワークフローを変える必要がないことです。なぜなら、病理専門医はいずれにしても、ホールスライドのレポートの分析と作成は行わなければならないからです。」

ソースの統合

病理専門医は一般に、組織スライド、免疫組織染色マーカー、ゲノムプロファイルなどの豊富なデータを用いて診断を行います。しかし現在のディープラーニングに基づく診断方法のほとんどは、単一のデータソースや簡単な情報統合手法に依存しています。

そのためマフムードラボの研究者は、顕微鏡とゲノムデータをよりにヒューリスティックかつ全体的な手法で組み合わせたメカニズムを開発しました。初期の研究結果によれば、ゲノムプロファイルとグラフ畳み込みネットワークから情報を追加すると、診断および予後モデルが改善される可能性があることが示唆されています。

病理ワークフローに組み入れる

マフムード氏は、病理専門医のワークフローにディープラーニングを統合するには 2 つの方法が考えられるとしています。まず、AI によって注釈が付けられたスライド画像を病理専門医のためのセカンドオピニオンとして活用し、診断の質と一貫性を向上させることが考えられます。

あるいは、計算病理ツールによってすべての陰性症例を除外することも考えられます。これによって病理専門医は、陽性の可能性がある生検スライドのみを審査するようにし、仕事量を大幅に減らすことが可能になります。これには先例もあります。1990 年代の病院で、第三者企業による子宮頸がん細胞診スライドのスキャンおよび層別化サービスを利用し、実際にすべての陰性症例を除外したことがあります。

マフムード氏は次のように述べています。「もし 4 万枚の乳がん組織のスライドがあって、そのうち 2 万枚が陰性の場合、これら半分が層別化によって除外され、病理専門医の目に触れることはありません。病理専門医の負担を減らし、診断のばらつきも減るでしょう。」

研究者は、そのアルゴリズムをテストして検証するため、ダナファーバーがん研究所 (Dana Farber Cancer Institute) からの生検データを用いて後ろ向き研究と前向き研究を実施することを計画しています。アルゴリズムによる判定を見た後で病理専門医が行う生検スライドの分析が変化するかどうか、また AI を用いることで診断のばらつきが減るかどうかが研究されます。

マフムードラボの研究者は、12 月の NeurIPS カンファレンスの ML4H ワークショップで、ディープラーニングプロジェクトについての発表を行う予定です。

メイン画像は、皮膚腫瘍の一種であるケラトアカントーマのホールスライド。アレックスブロロ ( Alex Brollo) 撮影、CC BY-SA 3.0 に基づき Wikimedia Commons によってライセンス許諾。