機械学習に対する全社的な取り組みの一環として、ソニーが自社の R&D センターに NVIDIA DGX SuperPOD を導入
次にくる大きな革新が何かを知りたいと思うのなら、それを何度も起こしてきた会社に尋ねるのがいいでしょう。
ソニーグループ株式会社R&D センター Tokyo Laboratory 16統括部長の影山雄一氏は次のように話しています。「AI は次の時代に不可欠なツールですので、ソニーでは、自社の開発者が AI を使って優れた成果を上げるのに必要な、コンピューティング リソースを提供していきます」
社内で「GAIA」と呼ばれているこのコンピューティング リソースは、R&D センター だけでなく、ソニーグループ全体で利用されているデジタル エンジンです。ソニーは、AI に対する全社的な取り組みを加速させるために、アクセラレーテッド コンピューティングのための、二度目の燃料を投入しようとしているのです。
ソニーのエンジニアたちは、Xperiaスマートフォンやエンタテインメント ロボットの aibo、そしてプロフェッショナル向けや一般消費者向けのカメラからファクトリー オートメーション、衛星に至るあらゆるイメージングの分野の製品に、機械学習で得られる知見を組み込もうとしています。さらに、AI の活用によって、次世代の、先進的なイメージング チップを作り上げようとしています。
コストを気にせず、より高速なAI開発環境を実現
AI 時代への移行を効率的に行うために、ソニーは、NVIDIA Mellanox InfiniBand ネットワークに接続された、NVIDIA DGX A100 システムのクラスタを導入しようとしています。同社は昨年10月、社内で AI のワークロードに対応するためにNVIDIA V100 Tensor コア GPU を搭載したシステムを導入し、フル活用していますが、このシステムをさらに強化する形になります。
「クラウド サービスを使用していたとき、AI 開発者たちはコストを気にする必要がありましたが、今後はGAIA を使って AI 開発に集中できるようになります」と影山氏は言います。
この社内用の AI エンジンであるGAIAは、パフォーマンス面でも貢献しています。あるチームは、超解像画像を生み出すディープラーニング モデルを設計し、トレーニングにより多くのリソースを割り当てることでトレーニングの速度が 16 倍速くなり、1 か月かかっていたワークロードを 1 日で実行できるようになりました。
社内の開発者のための、HPC とディープラーニングの分散学習技術を取りまとめている田中義己氏は、次のように話しています。「DGX A100のコンピューティング パワー、拡張された大容量の GPU メモリおよび高速の InfiniBand ネットワークにより、より大きなデータセットでさらに優れたパフォーマンスが発揮されると期待しています」
AI パイプラインの強化
2018 年、ソニーは、社内で開発されたディープラーニングフレームワーク「Neural Network Libraries」と産業技術総合研究所の 「AI橋渡しクラウド (AI Bridging Cloud Infrastructure、ABCI)」を活用した分散学習を行い、当時のディープラーニングのトレーニング速度の新記録を樹立しました。さらに、同社は、今年の CES で公開された映画撮影用ドローン Airpeak など、機械学習を活用した製品をすでに展開しています。
今後、このような製品が続々と登場することが予想されます。
影山氏は次のように話しています。「2021 年会計年度にはすばらしい成果を上げられるでしょう。ソニー内部に、優れたプロジェクトを開始している、たくさんのビジネスチームとのコラボレーションがあるからです。NVIDIA は、『GPU を使う文化』を育むためのソフトウェアとサービスを通じて大いに貢献してくれています」
たとえば、ソニーの開発者たちは、AI アプリの開発と稼働に必要な、すべてのソフトウェア コンポーネントを、NVIDIA のオンライン コンテナ レジストリである NGC より入手しています。
ソニーは、NGC で入手可能な、独自のコンテナも作成しており、このコンテナは同社の Neural Network Libraries および他のユーティリティに対応しています。また、このコンテナは、PyTorch や TensorFlow といった一般的な環境で動作するNVIDIAのコンテナを補完するものです。
さまざまなニーズを満たすソフトウェア
影山氏のチームの開発者たちは、コードを 1 か所に集約できれば作業が簡略化し、スピードアップする、と考えています。
システムをハイパフォーマンス コンピューティングに活用している一部の研究者は、AI を含む、さまざまなテクニカル アプリケーションを加速する、NVIDIA の CUDA ソフトウェアを使っています。
すべてのワークロードをスムーズに進行させるために、NVIDIA はジョブ スケジューラーを提供するとともに、NVIDIA のライブラリをソニー向けに拡張し、複数の GPU を横断してアプリケーションを利用できるようにしました。
「GAIA」システムの開発リーダーである原昌宏氏は、次のように話しています。「このような複雑なシステムにおいて利用の公平性を保ち、稼働率を高めるためには、優れた管理ソフトウェアが極めて重要です」
データ アナリティクスも視野に
NVIDIA はさらに、GAIA でソフトウェアが適切に使用されるようにするためのトレーニング プログラムの構築においてもソニーをサポートしています。
今後を見据え、ソニーは、データアナリティクスおよびシミュレーションにおける取り組みを強化したいと考えています。同社は、Python のプログラマーがデータサイエンスに GPU のパワーを活用できるようにするために NVIDIA が設計した、オープンソースのソフトウェア、RAPIDS の評価を行っています。
ソニーを AI のリーダーにするための在宅勤務が終わると、影山氏は、子供たちと一緒に遊び、子供たちはデジタルの世界でお父さんを翻弄しています。「『Minecraft』 はまだ初心者で、子供たちのほうが私よりはるかに上手なんですよ」と影山氏は話しています。