GTC 2020 の「I Am AI」ビデオが、分野を超えて世界中に影響を与える AI 技術を映画のように紹介。
AI は、私たちを火星に連れて行くロケット燃料であり、地球で私たちを救ってくれるワクチンです。そして、宇宙に痕跡を残そうと志す人々そのものです。
NVIDIA の 創業者/CEO であるジェンスン フアン (Jensen Huang) による GPU Technology Conference 基調講演で紹介された最新の「I Am AI」ビデオは、AI で歴史に残るような進歩を成し遂げている科学者、研究者、アーティスト、その他多くの人々に称賛をささげています。
AI の世界的なインパクトを理解するために、次のことを考えてみましょう。Gartner によれば、AI 技術は 2021 年までに 2 兆 9,000 億ドル相当のビジネス価値を生むと予想されています。
AI は、宇宙の起源を理解するために 2 兆個の銀河を分類し、新型コロナウイルスやがんの治療に必要な薬の分子構造を解明しようとしています。
最新のビデオで描かれているように、AI にも芸術的な側面もあります。ボブ ロス (Bob Ross) 氏のように絵を描くことができます。また、オリジナルの楽曲作りを支援する AI の能力は、ビデオで流れるテーマ音楽を演奏しているロンドン交響楽団にふさわしいものです。この作品は、リカレント ニューラルネットワーク (RNN) で書かれた曲をもとにしています。
AI は、短いドキュメンタリーのナレーション用に、テキストから合成音声を作ることもできます。ビデオの中で、AI はまさにこれを行っています。
これらをはじめとする鮮やかな技術の数々が、「I Am AI」の物語です。ビデオでは、16 の企業や研究機関が取り上げられています。展開が早く進むため、ポップコーンを山盛り抱えてリラックスしながら、2020 年の AI のハイライトをご紹介する当ツアーをお楽しみください。
宇宙へ手を伸ばす
宇宙にある構造物の成り立ちや物質の量を知るためには、銀河などの天体の観測と分類が必要です。観測可能な宇宙には調査すべき銀河が推定で 2 兆個もあり、宇宙論者はこれを「計算のグランド チャレンジ」と呼んでいます。
最新のダーク エネルギー サーベイでは、3 億個を超える銀河のデータが集められました。それをかつてない精度で調査するために、イリノイ大学アーバナ シャンペーン校にある米国立スーパーコンピューター応用研究所 (NCSA) の AI イノベーション センターは、米国エネルギー省アルゴンヌ国立研究所のアルゴンヌ リーダーシップ コンピューティング施設とチームを組みました。
NCSA は、スローン デジタル スカイ サーベイによる Galaxy Zoo プロジェクト (観測された数百万の銀河をラベル付けしたクラウドソーシングの天文学活動) を活用しました。そのデータを利用することによって、99.6% の精度を持つ AI モデルが、ラベル付けされていない銀河を識別して ID 付けし、科学研究を加速できるようになっています。
NASA は、2030 年代半ばまでに火星の有人探査をする目標を掲げています。この偉業を安全に達成するために、科学者は太陽と宇宙の天候が行程にどのように影響するかを理解しなければなりません。NASA の ソーラー ダイナミクス オブザーバトリーによって撮影された太陽の高解像度写真が、科学者のこの取り組みを支援しています。
NASA のゴダード宇宙飛行センターの研究者は、2010 年以降に撮影された膨大な数の太陽写真を分析するアルゴリズムを、NVIDIA GPU を使って開発しました。このアルゴリズムでは、写真の中のエラーを利用して、惑星間宇宙船に損傷を与える可能性のある地球軌道上の高エネルギー粒子の出所を特定しています。また、同じ写真を使って太陽表面の対流を追跡し、宇宙の天候を予測するモデルの改良も行っています。
声と手足を取り戻す
イスラエルのテル アビブに拠点を置くスタートアップ、Voiceitt は、信号処理、音声認識技術、ディープ ニューラルネットワークなどの開発を行っており、会話の音声にひずみが生じている人向けに合成音声を提供しています。同社のアプリは、不鮮明な音声を聞き取りやすい音声に変換します。
ノース カロライナ大学チャペル ヒル校の神経筋リハビリテーション エンジニアリング研究所と、ノース カロライナ州立大学のアクティブ ロボティック センシング研究所 (ARoS) では、研究所内で使われる実験的なロボット肢を開発しています。
両機関は義足の環境適応制御の開発を目指し、歩行環境認識に取り組んでいます。予測には畳み込みニューラルネットワーク (CNN) が使われており、NVIDIA GPU 上で実行されています。そして、これを利用しているのは彼らだけではありません。
パンデミックに対する支援
Whiteboard Coordinator は、建物に入る人々の体温をリモートで監視して、COVID-19 との接触を最小限にします。シカゴを拠点とするスタートアップである同社は、チェックポイントにおいて 1 時間あたり 2,000 人以上の割合で体温をスクリーニングできます。Whiteboard Coordinator と NVIDIA は、スマート センサーの開発と展開を簡略化するアプリケーション フレームワークである NVIDIA Clara Guardian を使用して、ヘルスケアのエッジに AI を導入しています。
Viz.ai は、AI を使って、従来の方法よりもはるかに早く神経内科医に脳卒中を知らせます。今回のパンデミックの到来を受け、Viz.ai は新しいウイルスとの戦いを支援すべく、COVID-19 の検査結果の陽性をケア チームに知らせるアプリを提供しました。
北アイルランドのベルファストに拠点を置くスタートアップ、Axial3D は、AI を活用して、外科手術計画に使われる医用画像の 3D プリント モデル作成時間を短縮しています。社内のリソースを COVID-19 に集中させって、同社は現在フェイス シールドを提供し、英国国民保健サービスのために人工呼吸器を製造しています。また、検査用の検体採取キットや人工呼吸器用のバルブの 3D プリントも始めています。(同社のオンデマンド ウェビナーをご覧ください)
カリフォルニア州バークレーの陽気なフードデリバリーロボット、KiwiBot は、その経路で COVID-19 関連のサービスを提供するようになりました。このロボットから人間へのサービスを通じて、マスクや消毒剤、その他の物資を自律配達しています。
(上記のすべての企業は、AI スタートアップ向けの NVIDIA Inception Program のメンバーです)
美術、作曲、ナレーションの傑作
ロンドンに拠点を置くスタートアップ、Oxia Palusの研究者は、論文「レイダース 失われたアート」の中で、塗り重ねられて失われた美術作品の再現に AI が利用できることを示しました。ピカソ (Picasso) の 1902 年の作品、「うずくまる物乞い (The Crouching Beggar)」の下には、バルセロナ近郊の「ラベリン ドルタ公園 (Parc del Laberint d’Horta)」ではないかと美術学芸員が考えている山の風景が描かれています。
サンティアゴ ルシニョール (Santiago Rusiñol) もまた「ラベリン ドルタ公園」を描いたことがわかっています。同社の研究者は、編集した「うずくまる物乞い」の蛍光 X 線画像と、サンティアゴ ルシニョールの「マヨルカ島のテラス式庭園 (Terraced Garden in Mallorca)」をもとに、NVIDIA GPU 上でニューラル スタイル変換を適用してこの失われた美術作品を再現し、ルシニョールの「ラベリン ドルタ公園」を創り出しました。
数年前の GTC の際、ルクセンブルクに拠点を置く AIVA AI は、オーケストラによる演奏にふさわしいオリジナルのクラシック音楽作品となる曲のメロディーと伴奏の最初の部分を作曲しました。その後、私たちはこの曲のためのオーケストラを見つけました。
昨年末、ロンドン交響楽団がこの胸を打つ作品を演奏してくれることになりました。この機会のために音楽家のジョン パエザーノ (John Paesano) 氏が編曲を施し、録音はアビー ロード スタジオで行われました。
NVIDIA の元社員のヘレン (Helen) は、何年もの間、NVIDIA のビデオやイベントでナレーションを務めたプロフェッショナルでした。ヘレンが退職したとき、私たちはこの慣例をどうしたら続けられるかを考え、私たちがよく知っているものに頼ることにしました。つまり、AI です。しかし、一般に公開されているモデルでは、この課題に対応できるものはありませんでした。
NVIDIA の応用ディープラーニング研究グループのチームは、この問題に対する回答を発表しました。それが、テキスト音声合成のための自己回帰型フローベース生成ネットワーク、Flowtron です。ヘレンの声をライセンスして、何十時間の音声を使ってネットワークを学習させました。
まず、当社のクリエイティブ ディレクターの指導のもと、ヘレンが複数の録音を行いました。次に、クリエイティブ ディレクターは Flowtron から複数の録音を生成できるようになり、モデルのパラメーターを調整して望みどおりの結果を得ることができました。その「ヘレン」の語りが、「I Am AI」ビデオでお聞きいただいているナレーションなのです。