深層学習の世界に飛び込むと、GTCがどれほど深いのかがよくわかります

安価なPCでもすてきな仮想世界が得られます。スーパーコンピュータなら銀河の生成さえもシミュレーションできます。人々が持つ携帯電話でさえ、何十年か前の世界一パワフルなコンピュータよりも高い能力を有しています。

でも、つい最近まで、「写真に鳥が写っているか」という小さな子どもでも答えられる質問をコンピュータにすると、最先端のシステムでもきちんと答えるのは難しいという状態でした。

いまは違います。新しいニューラルネットワークのアルゴリズム、蓄積された膨大なデータへのアクセス、パワフルなGPUが一体化したからです。その結果生まれたのが、「深層学習」という名の革命です。

大躍進

深層学習には無限の可能性があります。たとえば、癌細胞の発見に使おうという研究が進められています。環境破壊が進む浅瀬に生息しているサンゴの分類に使おうという研究もあります。ニューロン同士のつながりをマッピングしようという研究もあります。

だから、今年のGPUテクノロジ・カンファレンス(GTC)で深層学習が注目を集めているのです。GPUテクノロジ・カンファレンスとはNVIDIAが毎年開催している国際会議で、GPUテクノロジが科学や産業の世界をどのように変革しているのかを知ることができます。いま、変革の源として一番力があるのが、このテクノロジなのです。

NVIDIAのエンジニアリング・ディレクタ、ジョナサン・コーエン（Jonathan Cohen）は、次のように述べています。「深層学習テクノロジは、最近、素晴らしい進化をとげています――しかも急速に。永久に解けないと思われていた問題や、解けるのは当分先だと思われていた問題が、最近は、毎日のように解決されています。」

深層学習というのは、パターンの判別方法をマシンに教えるアルゴリズム（ステップ・バイ・ステップでデータを処理していく手順）を指します。これにより、コンピュータが高度な能力を身につけるのです。たとえば、話された言葉を認識する能力やそれをその場で別の言葉に翻訳する能力などです。

人間の上を行く

これは大きな変化です。

ほんの数年前、コンピュータは、人間なら簡単にできるタスクに苦労していました。ImageNet Large Scale Visual Recognition Challengeの結果を見るとそれがよくわかります。このコンテストでは、毎年、10万枚の画像と1000枚の説明ラベルが用意され、どこまで精度よく各画像に適切な説明ラベルを割り当てられるのかを競います。2011年の参加システムは、オブジェクトの1/4ほどをまちがえていました。

ところが、その1年後、ジェフリー・ヒントン（Geoffrey Hinton）氏が率いるトロント大学のチームがGPUを活用して誤答率を半減することに成功します。最近は、誤答率5％弱という記録をMicrosoft Researchが打ち立てました。これは、人間よりもよい成績です。

深層学習とはどのようなものなのでしょうか。深層学習では、まず、人工ニューラルネットワークを「訓練」します。そのために、画像や動画、音声など、雑多なデータをパワフルなコンピュータに供給します。

「深層」学習と呼ばれる理由

深層学習では、さまざまなレベルの抽象概念をニューラルネットワークに学ばせます。ごくシンプルな概念から複雑な概念まで、です。ここが、深層学習が「深層」たるゆえんです。レイヤごとに一定の情報を分類し、それを精製して、次のレイヤへ渡していくのです。

深層学習により、マシンは、このプロセスを使って階層的に認識を進めていけるようになります。たとえば、最初のレイヤではシンプルなエッジを探します（コンピュータビジョンの研究者は、これを「Gaborフィルタ」と呼びます）。次のレイヤでは、複数のエッジが長方形や円といったシンプルな形状を構成している部分を探します。3番目のレイヤで、目や鼻といった特徴を探します。このようにして五つとか六つのレイヤで処理した後、取得した特徴をひとつにまとめます。こうして、人の顔を認識できるマシンが完成するのです。

このような処理に最適なのがGPUです。GPUなら、1年以上もかかる処理を数週間や数日まで短縮できます。たくさんの計算処理を同時並行に進められるからです。そして、GPUを使ってシステムの「訓練」を終えれば、そうやって学んだ成果を活用できるというわけです。

ここで処理するタスクは、昔、不可能だと思われていたものです。たとえば音声認識。リアルタイムの通訳機能もそうです。ソーシャルメディアで交わされている会話に込められた気持ちを解析するシステムを研究している人たちもいます。

しかも、これはほんの始まりに過ぎません。だから、いま、世界各地の有名大学で深層学習の研究が急ピッチで進められているのです。Facebook、Microsoft、Twitter、Yahooといった有名企業やさまざまなスタートアップ企業も参入しています。

そして、GTCはこのようなパイオニアの多くが出席し、最新の成果を発表してくれる場なのです。

深く学ぼう－－GTCで深層学習についての知識を深めましょう

深層学習について詳しく学びたければ、GTCに参加するのが一番です。GPUが中心的役割を果たしているからです。今回のGTCでは、深層学習によるオブジェクト認識についてFacebookから発表が予定されています。Baidu、Microsoft、Twitterも参加します。ニューヨーク大学、カリフォルニア大学バークレー校、モントリオール大学の専門家も参加します。

3月17日から20日にシリコンバレーで開催されるGPUテクノロジ・カンファレンスへ、ぜひ、足をお運びください。自ら学ぶマシンの活用方法を学ぶいい機会です。詳しい情報が知りたい方やGTCへの参加登録を希望される方は、GTCにおける深層学習のページ（英語）をご覧ください。