NVIDIA CEO が予測する、AI 活用の産業革命

はじめに: この 6 週間、私たちは、NVIDIA の開発者カンファレンスを実施するワールド・ツアーに出ていました。この GPU テクノロジ・カンファレンス (GTC) は、大規模並列処理を行う GPU を使用する、ハイパフォーマンス・コンピューティングの新しいアプローチを推進するため、2009 年に始まりました。GTC は、モダン AI のビッグバンを活気づける新しいコンピューティングモデルである、GPU ディープラーニングの中心になってきました。AI が野火のように広がっていることは周知の事実です。GPU ディープラーニングの開発者数は、わずか 2 年間で 25 倍に跳ね上がりました。約 1,500 社の AI スタートアップ企業が誕生しています。この爆発的な成長により、GTC を世界中で開催してほしいという要求が高まりました。私たちはこれまでに、北京、台北、アムステルダム、東京、ソウル、メルボルンでイベントを開催しました。ワシントンは今週、ムンバイは来月に予定しています。私は、このうち 4 つの GTC でオープニングを務めました。ここにまとめたのは、私がお話したこと、学んだこと、そして、コンピューティングにおける次の波である AI が、次から次へとさまざまな業界を変革する近い将来において、私が予測することについてです。

コンピューティングの新しい時代

学習し、推論し、人々と対話する AI コンピューターによるインテリジェントなマシンは、すでに空想科学ではありません。現在、AI による自動運転車は、田舎道を夜間にさまよっていても、道を見つけることができます。AI によるロボットは、試行錯誤を繰り返しながら、運動スキルを学習できます。これは、実に驚くべき時代です。私がコンピューター業界で過ごした 30 年間で、今ほど可能性があり、楽しい時はありません。AI の時代が始まったのです。

私たちの業界は、大規模な産業の変革と社会の変革を推進しています。コンピューティングが進化するにつれ、新しい企業が組織され、新しい製品が構築され、私たちの生活は変わります。過去数回のコンピューティングの波を振り返ると、いずれも、革新的なコンピューティングモデル、つまり、機能と、コンピューティングの及ぶ範囲の両方を拡大する新しいアーキテクチャに支えられていました。

1995 年、PC-インターネット時代は、低コストのマイクロプロセッサー (CPU)、標準のオペレーティング・システム (Windows 95)、情報の世界への新しいポータル (Yahoo!) が一気に登場し、活気づきました。PC-インターネット時代により、約 10 億人がコンピューティングの恩恵を受け、「コンピュータをすべてのデスク、すべての家庭に」備えるというマイクロソフトのビジョンが実現されました。10 年後、iPhone により、「インターネットコミュニケーション」デバイスが私たちのポケットに収まりました。そして、Amazon の AWS の立ち上げと結びつき、モバイル-クラウドの時代が生まれました。アプリの世界が私たちの日常生活に登場し、約 30 億の人々が、モバイルコンピューティングがもたらす自由を享受しました。

今、私たちは、新しいコンピューティングモデルである GPU ディープラーニングが発火点になって起こった次の時代、AI コンピューティング時代の始まりにいます。この新しいモデルでは、ディープニューラルネットワークが大量のデータからパターンを認識するようトレーニングされますが、最も複雑なコンピューターサイエンスの問題の一部を解決するにあたり、「途方もない」効果を実証しています。この時代においては、ソフトウェアが自身のコードを記述し、マシンが学習します。遠くないうちに、何千億台というデバイスにインテリジェンスが注入されるでしょう。AI は、すべての業界を変革するのです。

GPU ディープラーニングの「ビッグバン」

なぜ今なのでしょうか。以前の投稿記事 (「GPU による AI の高速化–新たなコンピューティング・モデルの誕生」) に書いたように、2012 年は AI にとって歴史的に重要な年となりました。トロント大学のアレックス・クリジェフスキー (Alex Krizhevsky) 氏が、100 万のサンプルの中から画像を認識することを自動的に学習する、ディープニューラルネットワークを構築したのです。2 台の NVIDIA GTX 580 GPU を使ってわずか数日間のトレーニングを行っただけの「AlexNet」が、何十年にもわたって磨き上げられてきた人間の専門家のアルゴリズムをすべて打ち負かし、その年の ImageNet 大会で優勝しました。その同じ年に、ネットワークが大きければ大きいほど、つまり脳が大きければ大きいほど、学習できることも多くなるとの認識に基づき、スタンフォード大学の Andrew Ng 氏と NVIDIA Research がチームを組んで、大規模な GPU コンピューティングシステムを使ってネットワークのトレーニングを行う方法を開発しました。

これには世界が注目しました。世界中の AI 研究者が GPU ディープラーニングに目を向け、Baidu、Google、Facebook、Microsoft の各社が、パターン認識用として最初に採用しました。2015 年にはそれらが「超人的な」成果を上げ始め、今ではコンピューターのほうが私たち人間よりも高度に画像を認識できるようになっています。音声認識の分野では、Microsoft Research が GPU ディープラーニングを利用して、「人間並み」の会話音声認識能力を実現するという歴史的快挙を成し遂げました。

画像認識と音声認識において、GPU ディープラーニングは、マシンによる学習、認知、推論、問題解決の基礎を提供しています。GPU は、当初は人間の想像力をシミュレーションするためのエンジンとして開発され、テレビゲームやハリウッド映画の驚くべき仮想世界を創り出しました。今では NVIDIA の GPU は、ディープラーニング・アルゴリズムを実行して人間の知能をシミュレーションし、世界を認知して理解できるコンピュータ、ロボット、自動運転車の脳の役割を果たしています。人間の想像力と知能がリンクしているのと同様に、私たちのアーキテクチャでは、コンピューター・グラフィックスと人工知能が連動して働きます。人間の脳の 2 つのモード、GPU の 2 つのモード。こうした点を見ていただければ、NVIDIA GPU がディープラーニングに幅広く利用されていて、NVIDIA が次第に「AI コンピューティング企業」として知られるようになっている理由がお分かりいただけるのではないでしょうか。

新しいコンピューティングモデルのためのエンドツーエンドのプラットフォーム

新しいコンピューティングモデルである GPU ディープラーニングの登場により、ソフトウェアの開発方法および利用方法が変わりつつあります。以前は、ソフトウェアエンジニアがプログラムを作成して、アルゴリズムを綿密にコード化していました。しかし現在では、アルゴリズムが膨大な量の実例から学習し、ソフトウェアが自身のコードを作成します。プログラミングというのは命令のコード化のことであり、ディープラーニングとは、ニューラルネットワークを構築してトレーニングを行うことです。そうすると、ネットワークをデータセンターに配備して、そこに提供される新たなデータに基づき、推論、予測、分類を行わせることができるようになります。またネットワークは、カメラ、自動車、ロボットのようなインテリジェントデバイスに配備して、そこで世界を理解させることもできます。新しい経験に基づき、ニューラルネットワークをさらにトレーニングして改良するために、新たなデータが収集されます。何十億台ものデバイスから学習した事柄により、ネットワーク上のすべてのデバイスがさらにインテリジェントになります。ニューラルネットワークには、GPU 処理の急激な進歩と大きなネットワーク効果の両方のメリットがもたらされます。つまり、ニューラルネットワークは、ムーアの法則よりも速いペースでスマートになっていくわけです。

これまでのコンピューティングモデルでは「命令処理」が多く必要とされたのに対して、この新しいコンピューティングモデルでは大量の「データ処理」が必要とされます。AI のあらゆる側面を進歩させるために、私たちはエンドツーエンドの AI コンピューティングプラットフォームの構築を進めています。これは、トレーニング、推論、そして今後登場してくる何十億台というインテリジェントデバイスを網羅する 1 つのアーキテクチャです。

それではまずトレーニングから始めましょう。私たちの新しい Pascal GPU は、3 年間に及ぶ 20 億ドルの投資と数千人のエンジニアたちの努力の成果です。これは、ディープラーニング用に最適化された最初の GPU です。Pascal は、クリジェフスキー氏がみずからの論文⁽¹⁾ の中で使用した Kepler GPU よりも 65 倍も大規模または高速のネットワークをトレーニングできます。これまでに作られた中で最もスループットの高いインターコネクトである NVIDIA NVLink によって接続された、8 基の Pascal GPU が搭載されたコンピュータ 1 台で、従来のサーバー 250 台よりも高速にネットワークをトレーニングできます。

まもなく、毎日発生する何百億件ものインターネット・クエリに AI が必要とされるようになり、そのためそれぞれのクエリに何十億回も多くの演算操作が必要とされるようになります。リアルタイムの応答性を確保するためには、クラウドサービスにかかる総合的な負荷は莫大なものとなります。データセンターにおける推論性能を高速化するため、私たちは Tesla P40 GPU および Tesla P4 GPU を発表しました。P40 は、データセンターの推論スループットを 40 倍も高速化します。P4 は、消費電力がわずか 50 ワットで、ハイパースケール・データセンターにおいて一般的な 1U OCP サーバーを高速化するよう設計されています。ソフトウェアは、NVIDIA のディープラーニングプラットフォームの不可欠な要素です。トレーニング用ソフトウェアには、CUDA と cuDNN があります。推論用に、私たちは最適化推論エンジンの TensorRT を発表しました。TensorRT は、レイヤ内およびレイヤ間のオペレーションの融合、貢献度の低いウェイトの除去、FP16 または INT8 への精度の引き下げ、およびその他のさまざまな手法により、正確さを損なうことなく性能を向上させます。

いつの日か、何十億台ものインテリジェントデバイスがディープラーニングを活用して、一見したところインテリジェントのようなタスクをこなすようになるでしょう。ドローンが、自律的に倉庫内を検索し、品物を見つけて棚から取り出します。可搬式の医療機器が、AI を利用して現地で血液サンプルを診断します。インテリジェントカメラが、私たちが気にかけている状況だけを私たちに警告します。私たちは、そうしたインテリジェントな IoT デバイス用に、エネルギー効率の高い AI スーパーコンピューターの Jetson TX1 を開発しました。クレジットカードサイズのモジュールの Jetson TX1 は、たった 10 ワットの消費電力で1テラフロップの FP16 の性能を発揮します。これは私たちの最も強力な GPU と同じアーキテクチャで、まったく同じソフトウェアを実行できます。

要するに、私たちは、GPU からディープラーニングソフトウェアやアルゴリズム、トレーニング・システムから車載用 AI コンピューター、クラウドやデータセンターから PC やロボットに至るまでの、エンドツーエンドの AI コンピューティング・プラットフォームを提供しているわけです。NVIDIA の AI コンピューティングプラットフォームは至る所にあるのです。

あらゆる業界のための AI コンピューティング

私たちのエンドツーエンドのプラットフォームは、あらゆる業界が AI を活用できるようにするための第一歩です。NVIDIA GPU ディープラーニングをめぐるグローバルエコシステムは急速に拡大しています。画期的な成果が引き金となり、検索、認識、推奨、翻訳など、消費者向けインターネットサービスに AI を導入するレースが始まりました。Alibaba や Amazon、IBM、そして Microsoft に至るまで、さまざまなクラウドサービス・プロバイダーが、NVIDIA GPU ディープラーニングプラットフォームを、大小さまざまな企業に利用できるようにしています。世界最大規模のエンタープライズテクノロジ企業は、NVIDIA GPU を基盤にしてサーバーを構成しています。私たちは、以下の主要産業に取り組むため、GTC ツアーにおいて戦略的発表を強調しました。

AI 輸送: 10 兆ドル規模の輸送産業は、AI によって大きく変わる可能性のある巨大産業です。自律走行車は、事故を減らし、トラック輸送およびタクシー・サービスの生産性を向上させ、新しいモビリティサービスを可能にすることができます。私たちは、Baidu と TomTom の両社が、自動運転車用に NVIDIA DRIVE PX 2 を選んだことを発表しました。私たちはそれぞれの企業とともに、HD マップ、AI アルゴリズム、AI スーパーコンピューターが組み込まれた、オープンな「Cloud-to-Car」プラットフォームの構築を進めています。

運転というのは、私たちが第二の天性として行う学習行動です。その上、それを実行するようコンピューターをプログラミングすることが不可能なものでもあります。自律運転には、周囲の状況の認知、環境の状態を見極めるための推論、最善の行動方針の計画、および広大かつ多様な世界に対する私たちの理解を向上させるための絶え間ない学習という、AI のあらゆる側面が必要とされます。幅広い自律運転には、ハイウェイでの手放し走行から、目的地までの自律走行、さらには完全自律式の無人シャトルバスに至るまでの、オープンで拡張性の高いアーキテクチャが必要とされます。

NVIDIA DRIVE PX 2 は、自律運転用AIの全範囲を網羅することのできる拡張性の高いアーキテクチャです。GTC において私たちは、継続的位置特定および地図作成によるハイウェイ自動運転用に設計された、DRIVE PX 2 AutoCruise を発表しました。また私たちは、検出、位置特定、計画、行動という自律運転のあらゆる側面を網羅した、自動運転車用 OS の DriveWorks Alpha 1 もリリースしました。

私たちは、自分たちの能力のすべてを、当社独自の自動運転車である NVIDIA BB8 に注ぎ込みます。

NVIDIA は、画像処理、AI、ハイパフォーマンスコンピューティングの統合にイノベーションを起こすことに力を注いでいます。このユニークな組み合わせは、インテリジェントな自律マシンの心臓部にあたります。初めて、当社は、自動運転車と自律ロボットを実現する AI アルゴリズムを構築しました。しかし、このアルゴリズムには、コスト効率のよいリアルタイムのコンピューティングプラットフォームが必要です。

GTC において、当社のこれまでの取り組みの中で最も野心的なシングルチップコンピューターである Xavier を紹介しました。これは、世界初の AI スーパーコンピューター・チップです。70 億のトランジスタを搭載した Xavier は、最先端のサーバー用 CPU よりも複雑です。驚くべきことに、Xavier の処理能力は、今年 CED で発表された DRIVE PX 2 に匹敵し、毎秒 20 兆回の演算を実行できるディープラーニング性能を誇ります。しかし、消費電力はわずか 20 ワットです。フォーブズ誌では、当社が Xavier を武器に自動運転車市場に打って出たと報道されました。

企業の AI: コグニティブ・コンピューティングに 2 兆ドルの機会を見込んでいる IBM は、POWER8 と NVIDIA Tesla P100 を搭載した、AI を企業に提供するために設計された新しいサーバーを発表しました。ソフトウェアにおいては、SAP が、NVIDIA の DGX-1 スーパーコンピューターの最初の 2 台を受領し、190 カ国の 320,000 の顧客のために企業向けの機械学習ソリューションを積極的に構築していることを発表しました。

街の AI: 2020 年には、全世界のカメラの台数は 10 億にのぼるでしょう。監視システムの世界的なリーダーである HIKVISION 社は、街をより安全にするため AI を活用しています。同社はネットワークトレーニングに DGX-1 を使用し、Jetson TX1 プロセッサーを 16 基搭載した “Blade” という画期的なサーバーを構築しました。21 基の CPU を搭載した同性能のサーバーに比べて、Blade に必要なスペースは 1/20、電力は 1/10 です。

工場の AI: 世界には 20 億台の産業用ロボットがあります。日本は、ロボット工学のイノベーションが生まれる中心地です。GTC において当社は、産業用ロボットの大手日本企業であるファナック社が、端から端まで NVIDIA の AI プラットフォームを使用して未来の工場を作ることを発表しました。ディープニューラルネットワークのトレーニングに NVIDIA の GPU が使用され、GPU を搭載したファナック社の FOG 機器がロボットグループを操作し、複数のロボットが一緒に学習できるようにします。そして、すべてのロボットに、AI をリアルタイムで実行するための GPU が組み込まれます。この取り組みについては、MIT テクノロジレビューの記事「ファナックが NVIDIA と提携産業用ロボットに強化学習」で紹介されています。

あらゆる業界が新しい局面に: GPU のディープラーニングにより、医療、フィンテック、自動車、消費者向け Web アプリケーションといったさまざまな業界で多数のスタートアップ企業が新たに誕生しています。その数は全世界で 1,500 社以上です。カリフォルニアの道路で自動車をテストする許可を最近取得した Drive.ai 社は、ディープラーニングをドライビングスタック全体に適用することで自動運転車の課題解決に取り組んでいます。Chainer フレームワークの開発元である日本企業 Preferred Networks 社は、IoT のためのディープラーニングソリューションを開発しています。DGX-1 を最初に受け取った企業の 1 つである、ロンドンを拠点とする Benevolent.ai 社は、ディープラーニングを創薬に使用してパーキンソン病、アルツハイマー病、希少な癌といった病気に取り組んでいます。CB Insights によると、AI スタートアップへの資金提供は第 2 四半期で 10 億ドルを超えており、過去最高を記録しました。

スタートアップの急増は、業界を越えた AI の広がりを示す兆しでもあります。フォーチュン誌の最近の記事では、ディープラーニングが米国の企業を変えると評されています。

すべての人のための AI

AI は、数年前までまったく人の手に負えないと考えられていた問題の解決を可能にします。コンピューターは実世界のデータを学習することで、人が作ったソフトウェアはおろか、人にとっても複雑すぎる、広大すぎる、あるいは細かすぎるパターンを認識できます。GPU のディープラーニングによって、このようなコンピューティングモデルが実用化され、世界で最大規模の業界のさまざまな問題を解決するために適用できるようになりました。自動運転車は、10 兆ドルの規模を持つ運送業界を変革するでしょう。医療業界では、医師が AI を使用して、可能な限り早い段階で病気を発見したり、癌を治療するためにヒトゲノムを理解したり、大量の医療データや調査結果から学習して最適な治療方法を推奨したりできるようになるでしょう。そして、AI は、蒸気、大量生産、自動化に続く 4 番目の産業革命を起こし、インテリジェント・ロボット工学によって、生産性を向上させる新しい波が生まれ、大衆消費者のためのカスタマイズが可能になるでしょう。あらゆる人が AI に触れるようになるのです。AI 時代の幕開けです。

(1) 2013 年の K40 と比較した場合の毎秒画像処理数の向上。20 回の繰り返しをベースとする AlexNet トレーニングのスループット。CPU: E5-2680v3 12-core 2.5GHz 1 基。システムメモリ: 128 GB、Ubuntu14.04。M40 データポイント: ノード 1 つに M40 GPU 8 基。P100: NVLink 対応の P100 8 基。