CVPR で NVIDIA が最新 Tensor コア GPU AI ツール、Super SloMo、最新研究を発表

ソルトレークシティで開催された年次カンファレンス「Computer Vision and Pattern Recognition (以下 CVPR)」に集まった世界トップレベルの人工知能研究者数千人を前に、NVIDIA は AI による発見の次の大きな波を巻き起こす一連のツールとディープラーニング研究を発表しました。

最も大きな話題は、NVIDIA の Volta Tensor コア GPU のマルチプレシジョン機能を利用して AI 研究を加速させるのに役立つオープンソースエクステンション「NVIDIA Apex」の発表でした。

会場にずらりと掲載された研究ポスターの中には、通常のビデオからスーパースローモーションを作成する AI など、NVIDIA が発表した十数件の研究論文もありました。水曜の夜には、NVIDIA 創業者兼 CEO のジェンスンフアンが AI 研究者のために特別に製造した限定版 Titan V GPU を配布して参加者を驚かせました。

DALI: 最新 AI のエンジンを活性化する最新ツール

ショーの主役は、最新 AI のエンジンである NVIDIA Volta Tensor コア GPU でした。

Volta は GPU の再発明です。その革新的な Tensor コアアーキテクチャは、ディープラーニング行列演算を FP16 (半精度) にて 125 TFLOPS で実行し、数値範囲、精度、または数値安定性がさらに要求される場合は FP64 (倍精度) や FP32 (単精度) を使用することでマルチプレシジョンコンピューティングを実現します。

膨大なコードを精度と性能の両面で最適化するのは容易ではありません。しかし、Apex により、Tensor コア GPU に搭載されたマルチプレシジョンコンピューティング機能を従来にも増して簡単に利用できるようになります。開発者は、新たに提供される PyTorch エクステンションを使用して、AI トレーニングワークロードを必要な精度レベルに基づいて分割できます。Apex は、必要な場合は高精度の演算法、可能であれば効率的な低精度の演算法を自動的に適用することにより、驚異的な速度で AI モデルをトレーニングすることを可能にします。

NVIDIA GPU は計算ノードを超高速にしましたが、超高速であるが故に I/O (入出力) がボトルネックとなる可能性があります。しかし、GPU はデータ移動を加速することもできるため、その対策として、すべての主要フレームワークに対応したプラグインとして設計されたオープンソースライブラリ「DALI」を発表しました。

DALI を使用すれば、AI トレーニングにおいて典型的な画像の復号および水増しステップを高速化するための構成可能なデータ処理グラフを GPU に対して定義できます。これは、NVIDIA のデータサイエンティストが先日、16 基の Volta GPU を搭載した新しい NVIDIA DGX-2 にデータを送り、1 万 5,000 枚/秒という記録的な速度でのトレーニングを達成するうえで不可欠な技術でした。

DALI on Volta は、Apex によって Tensor コアに最適化されたフレームワークへのデータのロードを高速化します。その後、Volta GPU が超高速でモデルをトレーニングします。

さらに、AI を数千基の GPU までスケールアップするのに役立つツールとして、待望の Kubernetes on NVIDIA GPU (KONG) と TensorRT 4 も発表されました。KONG のリリースにより、開発者はマルチクラウド GPU クラスターへのトレーニングや推論の展開をシームレスにスケールアップできるようになります。TensorRT 4 はすでに一般提供が開始されており、Top-k、LSTM、バッチ GEMM などのレイヤーのアクセラレーションをサポートし、ニューラル機械翻訳、レコメンダー、音声アプリケーションの高速化を実現します。

NVIDIA リサーチの最先端研究

CVPR は、研究者が最先端のコンピュータービジョン研究を発表する場であり、現在 200 人以上の科学者を擁する NVIDIA リサーチが次のような技術、科学、および現実的課題の間にある問題に答える論文を発表する場として最適でした。

ビデオ内の次のフレームは推測可能か?
NVIDIA は、不足しているフレームをインテリジェントに補うことで 30 フレーム/秒 (fps) のビデオを 240 fps に変換できる新しい AI ネットワーク「Super SloMo」を構築しました。論文「Super SloMo: High Quality Estimation of Multiple Intermediate Frames for Video Interpolation」で記述されている技法により、標準映像から美しいスローモーションビデオが生成されます。標準機器で撮影した映像から素晴らしいスローモーションシーンを自由に創り出すことができる Super SloMo は、映画業界にとってキラーアプリとなります。
データの自動ラベル付けを行う AI があれば、どれだけ素晴らしいだろうか?
NVIDIA リサーチは、フランスのエコールポリテクニークとカナダのモントリオール大学と共に、正確かつ確実なジェスチャー認識、表情認識、顔認証、視線追跡のための特徴点位置推定ネットワークを構築しました。研究チームの論文「Improving Landmark Localization with Semi-Supervised Learning」は、多くの複雑な視覚問題における重要なステップである画像の特定部分の正確な位置の特定において、わずか 5% のデータにラベル付けをするだけで従来の方法を上回る性能を実現する、特徴点位置推定のための教師なし逐次マルチタスク学習方法のフレームワークを提示しています。
写真だけから新しい仮想世界を創り出せたら素晴らしいのではないか?
Conditional Generative Adversarial Network (GAN) を使用すれば、市街地の写真を撮って新しい仮想世界を再現できます。NVIDIA の自動運転車チームはこれを使用し、「High-Resolution Image Synthesis and Semantic Manipulation with Conditional GANs」に記述されている方法を用いて、NVIDIA DRIVE プラットフォーム向けのシミュレーションテストを設計しています。

点群を前処理なしで処理する新しいディープラーニングベースのアーキテクチャについて記述した NVIDIA SPLATNet に関する研究は、栄えある 6 つの CVPR 研究賞の 1 つを受賞しました。

私たちと共に世界の大きな課題に挑みませんか

NVIDIA の GPU アーキテクチャは、グラフィックス、アクセラレーテッドコンピューティング、AI の主要プラットフォームです。これらのアプローチを組み合わせることにより、驚くべき方法でイノベーションを引き起こすことができます。

NVIDIA RTX レイトレーシング技術を利用し、Volta Tensor コアおよび AI ノイズ除去と組み合わせることで、初めて映画品質のリアルタイムレンダリングを実現できます。これは、アニメーション、ゲーミング、プロダクトデザイン、アーキテクチャにおける究極の目標です。アーキテクトはクライアントと共にインタラクティブに設計でき、アニメーションスタジオは照明や素材をリアルタイムで実験できます。

あるいは、数十億マイル分の走行データでトレーニングすることにより、自律走行車を安全に走行できるようトレーニングするという課題もあります。しかし、公道を走行してデータを収集した場合、数年を要するかもしれません。そこで、NVIDIA はさまざまなテストシナリオ、シミュレーションセンサーを生成し、ニューラルネットワークを適用してテストし、現実世界の状況に反応する VR 自律走行車シミュレーターとして、DRIVE Constellation および Drive SIM を開発しました。本物の写真のような画質のシミュレーションは、自動運転車をより安全に、スケーラブルに、かつコスト効率よく実現する手段となります。

さらには、AI 画像診断スーパーコンピューター「CLARA」が生まれたきっかけとなった、疾患の早期発見という課題もあります。この 10 年間で、画像診断は再構成から画像処理、レンダリングまでコンピューターが使用されるようになり、AI アプリケーションが急増しています。CLARA は、既存機器のアップグレードから、新しいタイプの小型インテリジェントデバイスの導入まで可能なスケーラブルな AI スーパーコンピューターです。

AI は、私たちの家族や友人の今、そして未来にとって、より良い世界を夢見させてくれます。CVPR に足を運んで、私たちをこの会場に連れてきてくれた AI 研究者たちを称賛したり、AI の未来の発見に参加したりするのは本当に楽しいものです。