良いデザインは一目瞭然です。見れば分かります。
これに対して、それを実現するためのプロセスの背後にある試行錯誤の数々が人々の目に触れることはそれほど多くありません。デザイナー、メーカー、およびその他のクリエイティブなタイプの人々は、1 つのアイデアについて、複数のバリエーションを試す必要があります。画像をレンダリングするたびに、それを検証し、調整し、確認した上で、さらに別のバリエーションを試します。
これを繰り返す時間が取れるほど、最終的な成果は良いものとなります。当然ながら、「時は金なり」で、期日も迫ります。
NVIDIA の CEO 兼創設者であるジェンスン フアン (Jensen Huang) は、GPU テクノロジ カンファレンスにおいて、最終的なレンダリングを正確に予測できるよう、NVIDIA が人工知能をレイ トレーシングに適用することで、反復的なデザイン プロセスを発展させていることを紹介しました。 (レイ レーシングとは、複雑な数学により、特定の空間で光が表面とどのように作用し合うかについて現実的なシミュレーションを行う技術です。)
レイ トレーシング プロセスは、非常に現実的な画像を生成しますが、計算集約的で、画像に一定量のノイズを残します。鮮明なエッジや質感の詳細を保持しつつこのノイズを除去することを、業界ではノイズ除去と言います。フアンは、NVIDIA が、NVIDIA Iray を使用して、ディープラーニングの予測アルゴリズムを Pascal アーキテクチャベースの NVIDIA Quadro GPU と組み合わせることで、高品質ノイズ除去を初めてリアルタイムで実現したことを示しました。
これは、エンターテインメント、商品デザイン、製造、建築、エンジニアリングをはじめとする、グラフィックス集約型の数多くの産業における流れを大きく変えるものです。
この技術はさまざまなレイ トレーシング システムに応用できます。NVIDIA では Iray を筆頭に、既にディープラーニングの技法を自社のレンダリング製品に統合しています。
Iray のインタラクティブ ノイズ除去の仕組み
高品質ノイズ除去のための既存のアルゴリズムは、1 フレームあたり秒単位または分単位の時間を要し、インタラクティブな用途に実用的ではありません。
部分的に完成した結果から最終的な画像を予測することで、Iray AI では、最終的な画像のレンダリングを待たずに正確で写真のようにリアルなモデルを生成することができます。
デザイナーは、反復作業を行い、4 倍の速さで最終的な画像を完成させ、最終的なシーンやモデルをより迅速に把握できます。累計的な時間の節約により、事業の市場化計画を大幅に加速できます。
これを実現するために、NVIDIA の研究者やエンジニアは、オートエンコーダーというクラスのニューラル ネットワークに着目しました。オートエンコーダーは、画像解像度の向上、動画の圧縮、およびその他の画像処理アルゴリズムに用いられています。
NVIDIA DGX-1 AI スーパーコンピューターを使用することで、チームはノイズのある画像をクリーンな参照画像に変換するようニューラル ネットワークをトレーニングしました。24 時間以内に、ニューラル ネットワークに対して、3,000 の異なるシーンからのさまざまなノイズ量の15,000 の画像ペアを使用したトレーニングが行われました。ひとたびトレーニングされると、ネットワークは、元のトレーニング セットに含まれていなかったものも含め、ほとんどの画像において一瞬にしてノイズをきれいにします。
Iray では、ディープラーニング機能の仕組みについて心配する必要はありません。ネットワークは既にトレーニング済みであり、Iray の出力では GPU によって加速される推論を利用しています。クリエイティブな人材は、Pascal や、より優れた GPU との対話を、ボタンをクリックするだけで改善された画質で楽しむことができます。
Iray ディープラーニング機能は、ソフトウェア会社に提供する Iray SDK に含まれ、今年後半に生産する Iray プラグイン製品で明らかになる予定です。また、NVIDIA Mental Ray に AI モードを追加することも計画しています。さまざまなレンダラーがこの技術を採用することを予定しています。この技法の基盤については、7 月の ACM SIGGRAPH 2017 コンピューター グラフィックス カンファレンスにおいて発表します。詳しくはこちらをご覧ください。