NVIDIAのAIプラットフォームを活用したTelexistenceの新型ロボット、ファミリーマートで飲料陳列業務を自動化

投稿者: NVIDIA Japan

コンビニエンス ストアのバックヤードという、生活のごく身近な場所でも、NVIDIAの組み込みコンピューティング向けのプラットフォーム、NVIDIA Jetsonが活用されています。遠隔操作ロボットの開発で高い注目を集めるTelexistence株式会社(以下Telexistence)は、コンビニエンス ストアの飲料陳列業務を行う同社の最新型ロボット、「TX-SCARA」にNVIDA Jetson TX2NVIDIA Jetson Xavier NXを搭載し、ファミリーマート経済産業省店ファミリーマートALFALINK相模原店で稼働させています。

創業から一貫してNVIDIAのテクノロジを採用

創業からちょうど5年を迎えるTelexistenceは、代表取締役CEOである富岡 仁氏が東京大学名誉教授の舘暲博士に出会い、1980年に舘博士によって提唱された「TELEXISTENCE(遠隔存在)という技術コンセプトを社会に実装する」というビジョンに賛同したことが始まりでした。日本やその他の先進国においては、ますます希少になっていく人間の労働リソースを単純労働に分配するのは合理的ではなく、人はより付加価値の高い仕事を担うべき、という考えに基づいています。

以来、工場の外(世界)にロボットを実装し、世の中にある身体性を伴う単純労働をすべてロボットに置き換えることを目的に活動してきましたが、そのロボット開発において、当時から一貫してNVIDIAのテクノロジを採用し続けています。

Telexistenceの3作目のロボットとなる「TX-SCARA」は、コンビニのバックヤードから飲料を陳列するロボット自身のほか、人がVRで遠隔操作するコクピット、そしてその2つを中継するクラウドの3つの要素で構成されています。この構成自体は2作目の「Model-T」から継承していますが、TX-SCARAからは新たに、Telexistenceが開発したAIシステム「GORDON」をロボットとクラウド側に実装することで大きな進化を遂げています。

NVIDIA Jetsonが眼と頭脳の役割を果たす新型モデル、TX-SCARA

頭部と足部にNVIDIA Jetsonを搭載し、AIによる自律動作が追加されたTX-SCARA

2作目のModel-Tには、NVIDIA Jetson TX2を頭部に搭載し、ロボットの「眼」としてカメラから入力される映像の伝送に活用されていました。TX-SCARAはこれに加え、新たに足部にNVIDIA Jetson Xavier NXを搭載することで、AIによる自律動作機能を実現しています。例えば、陳列棚に並べる飲料はどの種類の缶とペットボトルであってもすべて同じアームで掴めるよう、アームの精度や強度、カメラの画角などが工夫されていますが、飲料によって「持ちやすい位置」はそれぞれ異なるため、アームで掴む端点の認識など、画像認識のニューラルネットワークをTX-SCARAで実行する必要があります。Jetson Xavier NXは最大 21 TOPS の演算能力により、このような最新のニューラルネットワークを並列で実行する性能を提供し、ロボットの頭脳の役割を果たすことができます。また、陳列棚の仕切り部分にアームを当てずに回避する、といった動作計画もJetson Xavier NXで実行されています。

NVIDIA DGX Stationを活用したAIの学習により、98%の認識精度を実現

TX-SCARAを通じて陳列棚の飲料の在庫状況は24時間モニタリングされていますが、クラウド側のAIシステムではこれを受けながら、商品の陳列タイミングの予測やスケジュ-リングを行い、TX-SCARAへの飲料補充の指示を行います。Telexistenceはクラウド側とTX-SCARAにおけるAIシステムの学習環境に、NVIDIAのAIワークステーションであるNVIDIA DGX Stationを活用しています。

「学習モデルのトレーニングにNVIDIA DGXを使うことで、あらゆるパターンでの商品陳列のシミュレーションを試すことができ、より最適な画像認識のモデルを効率的に作成することが可能になりました。」と、Telexistence株式会社CTOの佐野元紀氏は述べています。TX-SCARAに搭載しているAIの認識精度は98%に達しており、ロボットの失敗時や、予測し得ない状況が発生した場合のみ、コクピット側にいる人間が介入することで解決しています。

VRによるスムーズな遠隔操作にも必須なNVIDIA GPU

コクピットの役割を果たすTelexistenceの自社内の遠隔操作ブースでは、飲料の転倒時などに操縦者が対応しますが、ヘッドマウントディスプレイ (HMD) を着けた操縦者が上下左右に頭を動かしたときに、3D映像の動きが遅れてしまうと、VR酔いの原因になります。これを防ぐために、TelexistenceはVRの表示にも十分対応可能な画像処理性能を持つNVIDIAのGPUを採用することで、50ミリ秒の映像伝送を実現し、スムーズな遠隔操作を行っています。

「人がVRで遠隔操作をするためには低遅延で映像を伝送し、VR酔いを防ぐことが何より重要あり、そのためにはNVIDIAのGPUが必須でした。他社との比較も行いましたが、ハードウェアのパフォーマンスもさることながらNVIDIA Video Codec SDKのエンコーダーやデコーダー、CUDAやNVIDIA JetPack SDKなど開発環境がとても良く整備されており、開発のしやすさを高く評価しています。」と、佐野氏は述べています。

多台数展開を視野に開発環境を強化

Telexistenceは今後の課題のひとつとして自動制御による精度を98%からいかに99.9%に近づけていくための開発を挙げており、そのためにも、さらにメモリ容量の多いJetson製品の搭載を検討しています。また、ロボティクス シミュレーション アプリケーション、および合成データ生成ツールであるNVIDIA ISAAC Simをベースとしたシミュレーション環境の強化も視野に入れています。

Telexistenceはさらに、多関節ロボット ハードウェアの改良を重ね、コクピットでの多台数管理を進めることで、遠隔操作と自動制御のハイブリッド技術を軸にロボット ソリューションの展開を国内外の小売、物流の現場に拡大していく予定です。

※ブログ内の画像提供:Telexistence