フィンランドの研究チームとの初めてのプロジェクトで、GPU によりプライバシー アルゴリズムが 100 倍高速に
Linux の生みの親であるリーナス トーバルズ (Linus Torvalds) 氏の名声を凌駕するには至らないかもしれませんが、同じフィンランド人であるアンティ ホンケラ (Antti Honkela) 氏は近年、デジタル プライバシーに対する大きな障壁を取り除くことに成功しました。
ヘルシンキ大学のデータ サイエンスの准教授であるホンケラ氏は、差分プライバシーを研究しています。これは個人データに基づいたコンピューティングにて、個人データを非公開に保つことを保証する方法です。この新興分野は 3 月、絶大な影響を与えることが有望である点が評価され、MIT Technology Review の選ぶ「ブレイクスルー トップ 10 リスト (Top 10 list of breakthroughs)」に取り上げられました。
このテクノロジーの一部はすでに、スマートフォンやクラウド コンピューティングで広く利用されています。2020 年の米国国勢調査でもこのテクノロジーが採用される予定です。
「差分プライバシーは強力な理論的基盤の上に成り立っているため、アルゴリズムに従えばプライバシーが保証されますが、これまでの大きな問題はパフォーマンス コストが非常に大きいことでした」とホンケラ氏は述べています。
「今ではこのギャップを埋めることができます。」NVIDIA とフィンランドの AI 研究者との複数年にわたる広範な共同研究の最初のプロジェクトについて、ホンケラ氏はこう語りました。
差分プライバシーが 100 倍高速に
ホンケラ氏と NVIDIA のソリューション アーキテクトであるニキ ロッピ (Niki Loppi) は、差分プライバシーの学習を GPU で実行することで 100 倍に高速化する方法を実証しました。
「GPU を使用したこの種の高速化はよく見られますが、この高速化が優れている点は、標準の学習に差分プライバシーを追加するためのペナルティが、CPU システムでは 20 倍観察されたのに対し、GPU では 2 倍から 3 倍しか観察されなかったことでした」とロッピは語ります。
彼らの研究が示しているのは、機密性の高い個人情報が含まれているために現在は非公開でなければならない非常に有用なデータセットの匿名バージョンを作成する方法です。このようなデータのプライバシー保護されたバージョンが公開されることで、AI 開発者ははるかに優れたモデルを構築でき、この分野全体が加速されます。
後続の研究として、ロッピの NVIDIA の同僚たちにより、AI 学習でランダム サブサンプリングを行うための効率的な GPU による高速化アプローチを実装する方法の研究が進められています。この研究により、強化された差分プライバシーを実装する際のパフォーマンス ギャップをさらに縮める可能性があります。
この取り組みは、NVIDIA とフィンランドの強力な 2 つのパートナーとの共同研究における、多岐にわたる数多くのプロジェクトの中で最初に行われたものでした。フィンランド AI センター (FCAI) は、ヘルシンキ大学、アールト大学、フィンランド VTT テクニカル リサーチ センターからトップの研究者を集めた国家的な取り組みです。
NVIDIA、FCAI に続くもう 1 つのパートナーは、フィンランド国立スーパーコンピューティング センター (CSC) です。グループの研究プロジェクトは、320 基の NVIDIA V100 Tensor コア GPU を含む 2.7 ペタフロップスのシステムで稼働予定です。
幅広い AI ターゲット
フィンランドでの共同研究は、イタリアのモデナで 1 月に発足したプロジェクトに続くものです。NVIDIA AI テクノロジー センター (NVAITC) のグローバル コミュニティが拡大する中で彼らもこのコミュニティに参加しており、テクノロジーをさらに推進しています。
フィンランドでの研究では、多くの分野で現地パートナーの専門知識を活用して AI を推進していきます。 FCAI の担当教授であるホンケラ氏は、AI 研究者と GPU 専門家との共同研究は「優れたモデルだ」と語ります。
「研究者がコードを知っている必要があるのは明らかですが、この研究を効率的に実行する方法を理解することもこの研究における専門知識といえます。しかし、すべての研究者にこの知識があるわけではありません」と彼は述べます。
「こうした協力により、フィンランドでの AI 研究を後押しし、すでにこの分野で優れた研究を行っている現地の科学者をさらにサポートすることができます」と語るのは、NVIDIA の NVAITC シニア ディレクターであるサイモン シー (Simon See) です。
そして、いつどこから最高の成果が現れるかは誰にも分かりません。ホンケラ氏が言及するのは、すべてのニ ューラルネットワーク 学習の中心となるアルゴリズムである、誤差逆伝播法の効率的な最新バージョンがヘルシンキ大学の研究者から修士論文として初めて発表されたのは、1970 年だったということです。