技術的にとても難しい課題に対処するため、NVIDIAでは、ディープラーニング研究の分野にかつてないほどのスピードと使いやすさ、パワーをお届けできるハードウェアとソフトウェアを新たに開発しました。
ディープラーニングというのは、最近、急速に発展している人工知能の一分野で、医療や医薬品の研究から完全自律走行の自動車の開発にいたるまで幅広い分野におけるコンピューティング・イノベーションを推進する原動力となっています。
今回、GPU Technology Conferenceの開幕にあたり4,000人の来場者を前に行った基調講演で、NVIDIAのCEO兼共同創立者、ジェンスン・フアン(Jen-Hsun Huang)は、ディープラーニングに役立つ新技術、3種類を紹介しました。
- NVIDIA GeForce GTX TITAN X――史上最高にパワフルで、ディープ・ニューラル・ネットワークのトレーニングに最適なプロセッサ
- ディープラーニングGPUトレーニング・システムDIGITS――高品位なディープ・ニューラル・ネットワークの構築がすばやく簡単に行えるソフトウェア
- DIGITS DevBox――机の脇に置ける世界最速の深層学習アプライアンス――TITAN X GPUを4基搭載し、直感的に使えるDIGITSトレーニング・システムが用意された専用機
TITAN Xが持つもうひとつの顔
両刀づかい:Titan Xは、緻密な仮想世界を紡ぐこともできれば最先端科学の分野を強力に推進することもできます
TITAN XはNVIDIAのフラッグシップであるゲーム用GeForce GPUですが、同時に、ディープラーニングにも最適な製品となっています。
TITAN Xについては、2週間前、サンフランシスコで開催されたゲーム開発者会議でスニーク・プレビューを行いました。映画『ホビット』の竜をイメージした『Thief in the Shadows』という仮想体験で目を見はる世界を実現いたしました。
4K対応の最新AAAタイトルでTITAN Xを活用すると、息をのむほどの映像が楽しめます。たとえば『Middle-earth: Shadow of Mordor』の場合、昨年9月に発売したGeForce GTX 980ではFXAAをオンにしたハイ設定で30フレーム/秒が限界ですが、TITAN Xなら40フレーム/秒でゲームを満喫できます。
NVIDIA Maxwell GPUアーキテクチャを採用したTITAN Xは、先代モデルに比べてパフォーマンスも電力効率も倍になっています。3,072個の処理コアを活用し、12GBのオンボード・メモリで7テラフロップスものピーク単精度パフォーマンスをたたき出せるのです。
処理能力がこれほど高く、メモリ帯域幅も336.5GB/sもあるため、ディープ・ニューラル・ネットワークのトレーニングに使われる膨大な量のデータもさっと処理することができます。たとえば、120万枚の画像からなるImageNetデータ・セットを使って業界標準モデルのAlexNetをトレーニングする場合、16コアCPUが1個のシステムでは40日以上もかかるのに対し、TITAN Xでは3日もかかりません。
TITAN Xは本日より発売されており、価格は999ドルです。
DIGITS:極上のディープ・ニューラル・ネットワークをすばやく簡単に構築
ディープ・ニューラル・ネットワークを使ってコンピュータをトレーニングし、オブジェクトの認識と分類ができるようにするのは、時間のかかる大変な作業となります。
この状況を大きく変えるのが、ディープラーニングGPUトレーニング・システムのDIGITSソフトウェアです。DIGITSには、最良のディープ・ニューラル・ネットワークを構築するために必要なものすべてが用意されています。
画像分類用ディープ・ニューラル・ネットワークの設計から訓練、検証までをカバーする世界初のオールインワン・グラフィカル・システムなのです。DIGITSは、http://developer.nvidia.com/digitsからダウンロードできます。
DIGITSは、ディープ・ニューラル・ネットワークの設定から構成、訓練までユーザを導いてくれます。大変な作業はDIGITSがやってくれるので、ユーザは、研究の内容や結果に集中できるというわけです。
ローカル・システムの場合でもウェブからの場合でも、DIGITSを使えば、トレーニング用データ・セットの準備やロードが簡単に行えます。DIGITSには、直感的にわかるユーザ・インターフェースとワークフロー管理機能が用意されているからです。
リアルタイムのモニタリングと可視化ができる機能も世界に先駆けて搭載されているので、自分の仕事に合わせてユーザが細かくチューニングできます。GPUアクセラレーテッド版のCaffeもサポートしています。Caffeは、データ・サイエンティストや研究者がニューラル・ネットワークを構築する際によく使う人気のフレームワークです(詳しくは、NVIDIA Parallel Forallブログの記事DIGITs: Deep Learning Training Systemをご覧ください)。
DIGITSは、ディープ・ニューラル・ネットワークの設定から構成、訓練までユーザを導いてくれます。大変な作業はDIGITSがやってくれるので、ユーザは、研究の内容や結果に集中することができます。
DIGITS DevBox:デスクサイドに置ける世界最速のディープラーニングマシン
深層学習研究のスピードアップ・プラットフォームとなるオールインワンの強力マシンが、NVIDIAのディープラーニング・エンジニアリング・チームが自分たちの研究開発に必要だからと開発したDIGITS DevBoxです。
大変難しい深層学習研究において、高効率で高いパフォーマンスを発揮できるように、DevBoxの部品は、4基搭載されたTITAN X GPUはもちろんのこと、メモリからI/O、電源にいたるまで、すべてが最適化されています。
深層が解明できるマシン:DIGIT DevBoxのパーツは、すべて、ディープラーニング研究に最適化されています。
ディープ・ニューラル・ネットワークの開発でデータ・サイエンティストや研究者が必要とするソフトウェアは、すべて、プリインストールされています。DIGITSソフトウェア・パッケージも、深層学習フレームワークとして一番人気のCaffe、Theano、Torchも、また、NVIDIAが誇る堅牢なGPUアクセラレーテッド・ディープラーニング・ライブラリ、cuDNN 2.0もプリインストールされているのです。
これだけのものが、エネルギー効率が高く、静かで、発熱量が少なく、しかも、見た目もかっこいいパッケージにまとめられており、机の下に置いて普通のコンセントにつなぐだけで使うことができます。この研究用パワフル・マシンの価格は1万5000ドルです。
かなり前になりますが、マルチGPUトレーニングの効果を測定したところ、ディープラーニング関係のベンチマークにおいて、TITAN X 1基のマシンに対して4倍近いパフォーマンスをDIGITS DevBoxはたたき出しました。AlexNetのトレーニングは、シングルGPUのPCならどうやっても2日以上かかりますし、CPU 1基のみのシステムでは1カ月以上もかかりますが、DIGITS DevBoxなら13時間しかかかりません。
詳しくは、NVIDIA DIGITS DevBoxのページをご覧ください。