ディープラーニングによって不可能が可能になり、運転から音声認識、作曲まで、あらゆるものの自動化が進んでいます。そして今、米エネルギー省オークリッジ国立研究所 (ORNL) の科学者チームによって開発された新しいソフトウェアのおかげで、科学的発見が加速しようとしています。
ORNL の GPU アクセラレーテッド Titan スーパーコンピューターで研究を進める同チームは、ニューラル ネットワークを自動的に生成するアルゴリズムを開発しました。大まかに人間の脳内のニューロン間の相互接続をモデルにしたそれらのニューラル ネットワークは、ディープラーニングにおいて「学習」を担います。
MENNDL (Multi-node Evolutionary Neural Networks for Deep Learning = ディープラーニングのためのマルチノード型進化的ニューラル ネットワーク) は、科学者が収集するような特異なデータセットで、ニューラルネットワークの評価、テスト、提案を行います。そして、GPU アクセラレーションにより、数か月かかることもある作業がたちまち、わずか数週間に短縮されます。
「MENNDL によって時間を節約し、科学的発見を加速できるようになります」と、ORNL の Nature Inspired Machine Learning チームの研究科学者、スティーブン ヤング (Steven Young) 氏は言います。
科学者のための AI
MENNDL は ORNL チームが科学者のために開発したものですが、より大規模な変革を AI にもたらす可能性も秘めています。研究者の場合、ニューラル ネットワークのトレーニングを行うことで、特定のタスクを実行するソフトウェアを開発しますが、ORNL のソフトウェアはそのネットワーク自体を生成するため、これまでネットワークの構成に必要だった試行錯誤のプロセスが不要になるからです。
このアルゴリズムは、Titan に搭載された 18,688 個の Tesla GPU で拡張され、可能性のある何千ものネットワークを同時にテストし、トレーニングを行うことで、そのジョブにもっとも適したネットワークを予測します。
多くの分野では、研究者がディープラーニングの研究における出発点として、既存のニューラル ネットワークやデータセットを利用します。しかし、科学機器からデータを得て、そのデータがこれまでコンピューターに顔や音声の認識を学習させるために使われてきたものとは大きく異なる場合、研究者はそうすることができません。
「研究室では、ニュートリノ検出器や電子顕微鏡といった何らかの科学機器から得たデータを使います。それは、猫や犬の写真とはまったく異なるものです」と、ヤング氏は言います。
所要時間が 24 時間に
MENNDL によってすでにニュートリノ物理学の研究が加速しています。ニュートリノとは原子よりも小さな粒子であり、研究者はニュートリノによって宇宙の起源やものの本質のような謎を解明できると考えています。
ニュートリノは検出が難しいことで有名なため、DOE のフェルミ国立加速器研究所 (Fermilab) の研究チームでは、強力なビームを使ってそれらが通常の物質とどのように反応するかを研究しています。そして、その研究で生成される大量のデータを分析し、どこで相互作用が発生したのかを正確に特定する必要があります。
これまでなら、Fermilab チームは、ニューラル ネットワークをテストして問題に適したものを見つけるのに数か月かかった、とヤング氏は言います。しかし、MENNDL はその作業をたった 24 時間で成し遂げたのです。
「研究者が何か月もディープラーニング フレームワークに取り組まなくても、MENNDL ならデータに適したネットワークをたった 1 日で提示できます」とヤング氏。
これにより、研究者はより短い期間でより多くの実験をこなせるようになり、科学の進歩が加速されるわけです。
詳しくは、ORNL の論文「Optimizing Deep Learning Hyper-Parameters Through an Evolutionary Algorithm」をご覧ください。
* この記事のメイン画像は、フェルミ国立加速器研究所の MiniBooNE ニュートリノ検出器の内部を示しています。