新しい NVIDIA デジタルヒューマン テクノロジが業界を超えて顧客との対話を強化

投稿者: Ike Nnoli

NVIDIA ACE と Maxine の最新アップグレードが生成 AI による顧客サービス用のデジタルヒューマンを実現

生成 AI は、企業がデジタルヒューマン アバターを通じて顧客と関わる新しい方法を生み出しています。

SIGGRAPH で、NVIDIA は 感情やユーモアなどを使って人々とつながることができるインタラクティブなデジタル ヒューマンである James を公開しました。James は、カスタムで非常にリアルなインタラクティブ アバターを作成するためのリファレンスデザインである NVIDIA ACE を使用したカスタマーサービス ワークフローに基づいています。ユーザーはまもなく、ai.nvidia.com で James とリアルタイムで会話できるようになります。

NVIDIA はさらに、このコンピューターグラフィックス カンファレンスにおいて、没入型のテレプレゼンス エクスペリエンスを実現する Maxine 3D や Audio2Face-2D など、NVIDIA Maxine AI プラットフォームの最新の進歩も紹介しました。

開発者は、Maxine と NVIDIA ACE のデジタルヒューマン テクノロジを使用して、デジタルインターフェイスでの顧客とのやり取りを、より魅力的で自然なものにすることができます。ACE テクノロジは、音声と翻訳、視覚、インテリジェンス、リアルなアニメーションと動作、リアルな外観のための AI モデルを使用して、デジタルヒューマンの開発を可能にします。

さまざまな業界の企業が、Maxine と ACE を使用して、没入型の仮想顧客エクスペリエンスを提供しています。

デジタル ブランド アンバサダーの James を紹介します

NVIDIA NIM マイクロサービス上に構築された James は、文脈に沿って正確な応答を提供できる仮想アシスタントです。

Retrieval-Augmented Generation (RAG) を使用することで、James は最新の NVIDIA テクノロジについてユーザーに正確に伝えることができます。ACE を使用すると、開発者は独自のデータを使用して、顧客に関連情報を伝えることができるドメイン固有のアバターを作成できます。

James は、最新の NVIDIA RTX レンダリング テクノロジを使用し、高度でリアルなアニメーションを実現します。その自然な音声は ElevenLabs により実現されています。NVIDIA ACE を使用すると、開発者はさまざまなユースケースに合わせてアバターを作成する際に、アニメーション、音声、言語をカスタマイズできます。

NVIDIA Maxine がテレプレゼンスにおけるデジタルヒューマンを強化

デジタルヒューマンのオーディオとビデオの品質を強化する最先端の AI 機能を導入するプラットフォームである Maxine は、ビデオ会議デバイスにおいてはリアルタイムでフォトリアルな 2D および 3D アバターの使用を可能にします。

Maxine 3D は、2D ビデオポートレート入力を 3D アバターに変換し、非常にリアルなデジタルヒューマンをビデオ会議やその他の双方向通信アプリケーションに統合できるようにします。このテクノロジはまもなく早期アクセスで利用可能になります。

現在早期アクセス中の Audio2Face-2D は、オーディオ入力に基づいて静的ポートレートをアニメーション化し、1 つの画像から動的な会話するデジタル ヒューマンを作成します。このテクノロジは ai.nvidia.com でお試しください。

デジタルヒューマン アプリケーションを採用している企業

HTC、Looking Glass、Reply、UneeQ は、カスタマーサービス エージェントや、エンターテイメント、小売、サービス業におけるテレプレゼンス エクスペリエンスなど、幅広いユースケースで NVIDIA ACE と Maxine を使用している最新の企業です。

SIGGRAPH では、デジタル ヒューマン テクノロジ開発企業の UneeQ が 2 つの新しいデモを披露しました。

1 つ目のデモでは、拡張性とプライバシーを強化するローカルのブラウザー内コンピュータービジョンを備えた NVIDIA GPU によりクラウドレンダリングされ、Audio2Face-3D NVIDIA NIM マイクロサービスを使用してアニメーション化されたデジタルヒューマンに焦点を当てています。UneeQ の Synapse テクノロジは、匿名化されたユーザーデータを処理し、それを大規模言語モデル (LLM) にフィードして、より正確で応答性の高いインタラクションを実現します。

2 つ目のデモは、NVIDIA RTX GPU 搭載のノート PC 1 台で実行され、Gemma 7B LLM、RAG、NVIDIA Audio2Face-3D NIM マイクロサービスによって実行される高度なデジタルヒューマンをフィーチャーしています。

どちらのデモも、UneeQ の NVIDIA を活用した取り組みを紹介しています。これは、ユーザーの表情や動作に反応できるデジタルヒューマンを開発し、仮想カスタマーサービス エクスペリエンスのリアリズムの限界を押し広げるものです。

HTC Viverse は、Audio2Face-3D NVIDIA NIM マイクロサービスを VIVERSE AI エージェントに統合して、ダイナミックなフェイシャルアニメーションとリップシンクを実現し、より自然で没入感のあるユーザーインタラクションを実現しています。

ホログラム技術企業 Looking Glass が SIGGRAPH で行った Magic Mirror デモでは、シンプルなカメラセットアップと Maxine の高度な 3D AI 機能を使用して、新たに発売されたグループ表示可能な Looking Glass 16 インチおよび 32 インチ空間ディスプレイに、ユーザーの顔のリアルタイム ホログラフィック フィードが生成されました。

Reply は、Costa Crociere のクルーズ船 Costa Smeralda 向けに開発された最先端のデジタル ヒューマンである Futura の強化版を発表しました。Audio2Face-3D NVIDIA NIM および Riva ASR NIM マイクロサービスを搭載した Futura の音声合成機能は、GPT-4o、RAG 向け LlamaIndex、Microsoft Azure テキスト読み上げサービスなどの高度なテクノロジを活用しています。

Futura には、包括的な感情認識のために、Reply 独自の感情コンピューティングテクノロジと Hume AI および MorphCast も組み込まれています。Unreal Engine 5.4.3 と MetaHuman Creator を使用して構築され、NVIDIA ACE 搭載のフェイシャルアニメーションを備えた Futura は、6 つの言語をサポートしています。インテリジェント アシスタントは、個別の港訪問の計画、カスタマイズされた旅程の提案、ツアーの予約の円滑化に役立ちます。

さらに、Futura はゲストのフィードバックに基づいて推奨事項を改良し、特別に作成されたナレッジ ベースを使用して有益な都市情報を提供し、観光客の旅程を充実させます。Futura は、顧客サービスを強化し、現実世界のシナリオで没入型のインタラクションを提供することで、業務の合理化とビジネスの成長を促進することを目指しています。

NVIDIA ACENVIDIA Maxine の詳細をご覧ください。

SIGGRAPH での NVIDIA の創業者/CEO であるジェンスン フアン (Jensen Huang) の対談を視聴し、アクセラレーテッド コンピューティングと生成 AI がどのように業界を変革し、イノベーションの新たな機会を生み出しているかをご覧ください。

ソフトウェア製品情報については、お知らせをご覧ください。