Boston Dynamics、Collaborative Robotics、Covariant、Sanctuary AI、Unitree Robotics などがロボティクスに LLM を採用
生成 AI は数兆ドル規模の産業を再構築しており、スマート ロボティクスのフロントランナーである NVIDIA はそのタイミングを捉えています。
本日、CES に先立つ特別講演の一環として講演した NVIDIA のロボティクスおよびエッジ コンピューティング担当バイスプレジデントの ディープゥ タッラ (Deepu Talla) は、NVIDIA とそのパートナーが生成 AI とロボティクスをどのように融合させていくかについて詳しく説明しました。
Boston Dynamics、Collaborative Robotics、Covariant、Sanctuary AI、Unitree Robotics などを含むパートナーが増え続けているのは、GPU で高速化された大規模言語モデルを採用して、あらゆる種類のマシンに前例のないレベルのインテリジェンスと適応性をもたらそうとするための、自然の流れと言えます。
まさに、これ以上ないタイミングです。
「人工知能を搭載した自律型ロボットは、効率の向上、コストの削減、労働力不足への取り組みのためにますます活用されるようになっています」と、タッラは言います。
創造の場に立ち会う
NVIDIA は、当初から生成 AI 革命の中心的存在でした。
10 年前、NVIDIA の創業者/CEO であるジェンスン フアン (Jensen Huang) は、最初の NVIDIA DGX AI スーパーコンピューターを OpenAI に直接手渡しました。現在、OpenAI の ChatGPT のおかげで、生成 AI は現代で最も急速に成長しているテクノロジの 1 つとなっています。
そしてそれはまだ始まったばかりです。
生成 AI の衝撃は、テキストや画像の生成を超え、家庭やオフィス、農場や工場、病院や研究所にまで及ぶだろうとタッラは予測します。
重要な点は、LLM は脳の言語中枢に似ており、ロボットが人間の指示をより自然に理解して応答できるようになるだろうということです。
このようなマシンは、人間から、相互に、そして周囲の世界から継続的に学習できるようになります。
「これらの特性を考慮すると、生成 AI はロボティクスに非常に適しているのです」と タッラは言います。
ロボットは生成 AI をどのように使用しているか
Agility Robotics やNTTなどは、ロボットに生成 AI を組み込んで、テキストや音声コマンドを理解できるようにしています。Dreame Technology のロボット掃除機は、生成 AI モデルによって作られたシミュレートされた生活空間でトレーニングされています。そして、Electric Sheepは自律型芝刈り機の世界モデルを開発中です。
AI 搭載ロボットの開発と展開を容易にする NVIDIA Isaac や Jetson プラットフォームなどの NVIDIA テクノロジは、すでに 120 万人を超える開発者と 10,000 の顧客およびパートナーへの信頼を築いています。
今週の CES には、Analog Devices、Aurora Labs、Canonical、Dreame Innovation Technology、DriveU、e-con Systems、Ecotron、Enchanted Tools、GlüxKind、Hesai Technology、Leopard Imaging、Segway-Ninebot (Willand (Beijing) Technology Co., Ltd.)、Nodar、Orbbec、QT Group、Robosense、Spartan Radar、TDK Corporation、Telit、Unitree Robotics、Voyant Photonics、ZVISION Technologies Co., Ltd. などの多くの企業が参加します。
2 つの頭脳は 1 つよりも優れている
CES での講演で、タッラはロボティクスにおける AI の導入に不可欠なデュアル コンピューター モデル (下図) を示し、AI の開発と応用に対する NVIDIA の包括的なアプローチを披露しました。
「AI ファクトリー」と呼ばれる最初のコンピューターは、AI モデルの作成と継続的な改善の中心となります。
「AI ファクトリー」は、AI モデルのシミュレーションとトレーニングのために、NVIDIA のデータセンター コンピューティング インフラストラクチャと、NVIDIA の AI および NVIDIA Omniverse プラットフォームを使用します。
2 番目のコンピューターはロボットの実行環境を表します。
これはアプリケーションによって異なります。クラウドまたはデータセンター内、または半導体製造における欠陥検査などのタスクにおけるオンプレミスのサーバー内、あるいは複数のセンサーとカメラを備えた自律型マシン内で実行されます。
高品質のアセットとシーンの生成
タッラはまた、技術的な障壁を取り払い、一般的なユーザーを、複雑なロボティクス ワークセルや倉庫全体のシミュレーションを作成できるテクニカル アーティストへと変容させる LLM の役割も強調しました。
NVIDIA Picasso のような生成 AI ツールを使用すると、ユーザーは単純なテキスト プロンプトからリアルな 3D アセットを生成し、それをデジタル シーンに追加して、動的で包括的なロボットのトレーニング環境を実現できます。
同じ機能は、Omniverse での多様で、物理的に正確なシナリオの作成にも拡張され、ロボットのテストとトレーニングを強化して現実世界への適用性を確保します。
これは、ロボットの展開を再構成する際の生成 AI の変革の可能性と連動しています。
従来、ロボットは特定のタスク専用に作られており、別のタスクに合わせてロボットを改造するのは時間のかかるプロセスでした。
しかし、LLM とビジョン言語モデルの進歩により、このボトルネックが解消され、自然言語を通じてロボットとのより直観的な対話が可能になったと、タッラは説明しました。
このようなマシンは、適応力があり周囲の環境を認識しており、間もなく世界中に広がるでしょう。
詳細については、オンラインの CES セッションに参加し、講演をご覧ください。