Google、会話、動画、画像の認識をGPUで一新

投稿者: Brian Caulfield

ゲーマの諸君、ここまでだ。君たちの時代は終わった。

ディープラーニングと呼ばれる新技術を使い、昔、Atariから出ていた名作ビデオゲーム50種類を完璧にプレイできるマシンをGoogleが作りあげました。スペースインベーダーのあんなプレイ、いままで誰も見たことがありません。

これぞ、スペースインベーダーの遊び方。

もちろん、誰かがきみのGeForce GTX 980を取りあげようとしているわけではない。

ビデオゲームを支えているものと同じGPUテクノロジを使い、Googleは、そんなことができるなど誰も想像しなかったことを実現したのです――この水曜日、今年のGPU Technology Conferenceの基調講演で、Googleのシニア・リサーチ・フェロー、ジェフ・ディーン(Jeff Dean)は、高らかにこう宣言しました。


ディープラーニングにより、コンピュータは、まだ当分不可能だとほんの数年前に思われていたことができるようになりました。

ウェブの土台となっているインフラストラクチャを一変させる新世代のテクノロジを、ディーンらを中心とするGoogleのエンジニアは作りあげました。

彼らが次の目標に定めたのは、口頭による意思伝達や視力、言語モデリング、ユーザによる操作の予測、翻訳など、SF世界の夢想だと思われていた領域です。そして、ブレイクアウトというブロックくずしなど、昔の名作コンピュータ・ゲームを完璧にこなすマシンを作ってしまったわけです。

デジタル「頭脳」の構築

このようなマシンができた背景には、人間の頭脳をモデルとしたニューラル・ネットワークの構築があります。もちろん、正確に模倣できているわけではありません。いまのデジタル頭脳と人間の頭脳は、せいぜい、鳥の翼をもとに飛行機の翼が作られたという程度の関係にすぎません。

「深奥にある化学的送信機のレベルで頭脳をシミュレーションしようとしているわけではありません。もっと高次元の抽象化したレベルで取り組んでいるわけです」とディーンも述べています。

生物の頭脳と同じように、新しいデジタル頭脳も、なにもないところから複雑なタスクをこなせるレベルまで自己学習する高度なアルゴリズムを備えています。小さな子どもにたくさんのボールを見せれば、そのうち、種類の違いがわかるようになるのと同じ原理です。

「なんだ、そんなことか」と思われるかもしれませんが、トレーニングでコンピュータがこのようなタスクをこなせるようになるのなら、時間を大きく節約できるのです。ディーンもこう語っています――「目的のひとつは、エンジニアの労力を減らすことです。高次の抽象化能力をアルゴリズムが自動的に構築してくれる部分については、ディープラーニングアルゴリズムに任せたほうがいいと思います。」


Googleでは、人間がプログラミングしたのでは時間がかかりすぎるタスクの処理をアルゴリズムでやろうとしています。

トレーニングが終われば、そのモデルを現実世界のアプリケーションに埋め込むことができます。すでに2012年から、Googleは、ディープラーニングを使った予測型音声認識の機能をAndroidスマートフォンに搭載しています。実際の処理はAndroid Jellybeanに組み込まれたソフトウェアとGoogleのパワフルなサーバの両方を使って行われます。ディーンによると、Googleがディープラーニングを応用している製品版アプリケーションは50種類を超えているそうです。

ディープラーニングの推進という面でGoogleは絶好の位置にいます。検索ビジネスから、テキストや画像という形で膨大なデータが得られるからです。また、検索ビジネスのために構築した分散型コンピューティング・インフラストラクチャがあるので、データをばりばり処理していくことができます。

さまざまなタスクをすばやく処理できるようにニューラル・ネットワークをトレーニングできるようになろうと、Googleは、いま、このインフラストラクチャにGPUを追加しているところです。GPUは膨大な数のタスクを同時に処理できるように作られており、その並列処理機能を活用して、システムのトレーニングを短時間ですませようというわけです。

その結果、住所を特定したり写真を分類したり、講演のテープ起こしをしたりといった、ほんの数年前には不可能だと思われていたことがコンピュータで処理できるようになりました。


検索の巨人GoogleがGPUを活用し、ディープラーニングの高速化を実現したというジェフ・ディーンの話に数千人もの人々が聞き入りました。

「このようなモデルがすごくパワフルだと思うのは、ある形式で受け取ったものを別の形式に変換できる点です。たとえば、ピクセルを受け取ってテキストに変換するといったことができるわけです。」とディーンは述べています。

ゲームをプレイする

一番の注目を集めたのは、もちろん、ビデオゲーム関連です。ディーンによると、ロンドンの研究グループが構築したディープラーニングシステムに、Atariの名作ビデオゲーム50種類を与え、なるべく高いスコアを得るように指示したのだそうです。

滑り出しは悲惨でしたが、何百回かプレイすると、人間を超えた能力を示すようになりました。スペースインベーダーではエイリアンの群れを蹴散らし、エンデューロレーサーではオートバイでカーブを次々とクリアしていくようになったのです。

ボクシングのゲームでGoogleのディープラーニングシステムが対戦相手をぼこぼこにしている映像を見せながら、「レフェリー・ストップを要請したほうがいいんじゃないかと思います」とディーンはコメントした。