通りがかった人の年齢を推測する屋外広告板。ユーザやそのペットの顔を認識する写真アプリ。二次方程式を解いたり、その解き方を教えたりしてくれるデジタル数学アシスタント。
携帯電話も、ほんの数年前には不可能だと思われていたことまでできるようになっています。これは、ディープラーニングのおかげです。
ディープラーニングというのは人工知能研究の一分野で、これを使えば、コンピュータビジョンや自然言語処理のスキルをコンピュータが活用し、みずからの周囲を解釈できるようになっていくことができます。
いま、このテクノロジを世界中の人々に使ってもらおうと、さまざまなスタートアップ企業がしのぎを削っています。そこで活用されているのが、NVIDIAのGPUとディープラーニング・ソフトウェアです。
現実世界の分析:的確な広告を自動的に提供
英国のReal Life Analytics社は、デジタル・ディスプレイに取り付けるドングルというものとウェブカメラを小売店に配布し、店内広告をターゲット型にしようとしています。とてもシンプルなシステムに思えますね。でも、ドングル内部ではディープラーニング・ソフトウェアが走っており、驚くほどのことが行われています。
ディスプレイに取り付けられたウェブカメラに人が近づくと、ディープラーニング搭載ニューラル・ネットワークが年齢と性別を判断します。そして、わずか数ミリ秒のうちに、その人の属性に合わせた広告を表示するのです。同時に、cuDNNで高速化したCaffeフレームワークを使い、DIGITSディープラーニング・トレーニング・ソフトウェアで構築したディープラーニング・ネットワークが、対象者の反応をリアルタイムに分析します。実際に処理をしているのは、もちろん、NVIDIAのTegraチップです。
ZZ Photoの「DeepPet」アルゴリズムは、従来のオブジェクト認識に比べて精度が5倍に達します。
ZZ Photo:ペットの写真を飾る
ウクライナのスタートアップ企業、ZZ Photoなら、PCにため込んだ何千枚、何万枚もの写真をさっと整理してくれます。CUDA対応GPUでニューラル・ネットワークの計算をスピードアップし、PCに保存された写真を検出。さらに、顔や情景、ペットなどのタグを写真に付けて並べ替えてくれるのです。
え?っと思った方がおられるかもしれませんね。そうなんです。ZZ Photoの「DeepPet」アルゴリズムは、ラブラドゥードルとチワックスを見分けられるのです。犬や猫の認識精度は、従来のオブジェクト認識アルゴリズムの最大5倍に達します。
MicroBlink:数式を解いてくれるアプリがNo. 1に輝く
MicroBlink社のPhotoMatchアプリは、リアルタイムに数学の問題を読み、解くことができます。
米国で新しい学年が始まる9月初旬、MicroBlinkのPhotoMathアプリは、iPhone用無料アプリで米国No. 1のダウンロード回数を記録しました。このアプリは、リアルタイムに数学の問題を読み、解くことができるのです。ユーザがしなければならないのは、スマートフォンやタブレットで問題の写真を撮ることだけです。
クロアチアのザクレブで創業されたMicroBlink社は、NVIDIAのGPUを使ってPhotoMathのディープラーニング・アルゴリズムをトレーニングしています。その結果、このアプリは、分数や不等式、二次方程式などが扱えるようになりました。また、問題の解き方をステップ・バイ・ステップで教えてもくれます。親世代も、子どもの宿題チェックに便利だと絶賛しています。
HyperVerge:画像の革新的な識別が可能に
運転免許証の写真を探し出すのに山のような自撮り写真をスクロールしていく必要はもうありません。インド発祥のスタートアップ企業、HyperVerge社がSilverというアプリを開発してくれたからです。これはモバイル機器で使える画像認識のアプリで、データ処理とアプリケーション・エンジンのトレーニングにはGPUが使われています。
このアプリは、モバイル機器に保存されている写真を整理してくれます。写真に写っている顔やスクリーンショット、記念品で分類してくれるのです。それだけではありません。手書きのメモや身分証明書、小切手などが写っていると、ドキュメントであると分類してくれます。画質の悪い写真があったり重複する写真があったりしたら削除してくれるツールも用意されています。
ViSenze:キーワードなしで検索
ViSenzeの画像認識テクノロジなら、驚くほどの精度でビジュアル・サーチができます。
百聞は一見にしかずというほど映像の情報量が多いのであれば、なにが悲しくて、さまざまなキーワードを検索エンジンに打ち込まなければならないのでしょうか。そんな悩みが解消されました。電子商取引のプラットフォームをビジュアルに検索する方法を、シンガポールのスタートアップ企業、ViSenzeが開発してくれたのです。ディープラーニングを活用したViSenzeのプラットフォームに画像をドロップすると、似たような画像を次々と見つけてくれます。キーワードも不要ですし、手作業でタグ付けをする必要もありません。
ViSenzeの画像認識テクノロジでは、実は、形状や色、パターンなどの属性からタグをつける作業が自動的に行われます。つまり、ちょっといいドレスを見つけ、ひいきにしているオンラインショップにそれと似た「袖無し」のものがないか探したいといった場合や、いい感じのハンドバッグを見つけ、使っている「皮」が違うものを見てみたい、あるいは、もうちょっと上が絞られた形のものがないか探したいといった場合、ViSenzeなら、驚くほどのスピードと精度で見つけてくれるのです。
すさまじいばかりのコンピューティング・パワーを多くの人の手に
今回は、NVIDIAのGPUを使ってディープラーニング革命を推進しているスタートアップ企業を数社、ご紹介しました。このような状況になっていることは、ある意味、驚くようなことではありません。GPUアクセラレーションは、ディープラーニング・アルゴリズムとの相性が理想的と言えるほどいいからです。そして、このようなアルゴリズムは、いま、医療画像の分析から自律走行の自動車まで、さまざまな分野で活用が進められています。
このようなアルゴリズムをうまく処理できるようにコンピュータをトレーニングするためには、コンピュータに自学自習させる必要があります。そして、そのためには、膨大な量のデータを処理しなければなりません。NVIDIAのディープラーニング・ソフトウェア、DIGITSとcuDNNプログラミング・ライブラリを使えば、そのような処理を高速化できます。DIGITS DevBoxという、すぐに使えるツールも用意されています。4個のNVIDIA GeForce GTX TITAN X GPUとDIGITSソフトウェア、DIGITSディープラーニング・ツールを組み合わせれば、世界最速のデスクトップ型ディープラーニング・マシンが完成します。
このようなツールが登場したいまなら、スタートアップ企業も、巨大なサーバ・ルームを持つ大手テック企業と肩を並べてディープラーニングに挑戦することが可能なわけです。
GPUの活用を進めているスタートアップ企業にとって、自社の画期的な成果をアピールする最高の場となるのが、年に一度の新興企業サミット(Emerging Companies Summit)です。最も有望だと思われる案件には、NVIDIAから10万ドルの賞金も授与されます。このイベントはGPU Technology Conferenceの一環として、今年は2016年4月6日に丸1日をかけて行われます。