新しい NVIDIA NeMo Retriever マイクロサービスが LLM の精度とスループットを向上

by Erik Pounds · July 26, 2024

hdr-nemo-retriever-microservices-720x340

企業は、Cohesity、DataStax、NetApp、Snowflake プラットフォームに統合された、RAG 向けの本番環境対応の NVIDIA NIM 推論マイクロサービスを使用して、ビジネスデータの価値を最大限に引き出すことが可能になります。

生成 AI アプリケーションは、正確性がなければほとんど価値がなく、時にはマイナスになることさえあります。そして、正確性の元になるのは、データです。

開発者が AI アプリケーションに対し知識に基づいた応答を生成する上で、最適な独自データを効率的に取得できるようにするため、NVIDIA は本日、4 つの新しい NVIDIA NeMo Retriever NIM 推論マイクロサービスを発表しました。

同じく本日発表された Llama 3.1モデルコレクション向けの NVIDIA NIM 推論マイクロサービスと組み合わせることで、NeMo Retriever NIM マイクロサービスは企業が AI アプリケーションが最小限の介入や監督で正確に動作するエージェント AI ワークフローに拡張しながら、最高精度の RAG (検索拡張生成) を提供することを可能にします。

NeMo Retriever により、組織はカスタムモデルを様々なビジネスデータにシームレスに接続し、RAG を使い AI アプリケーションに高精度の応答を提供できます。本質的には、本番環境対応のマイクロサービスにより、高精度の AI アプリケーションを構築するための高精度の情報検索が可能となります。

例えば、NeMo Retriever は、AI エージェントやカスタマーサービスチャットボットの作成、セキュリティの脆弱性の分析、複雑なサプライチェーン情報からの洞察の抽出を行う開発者のために、モデルの精度とスループットを向上させることができます。

NIM 推論マイクロサービスは、高性能で使いやすいエンタープライズグレードの推論を可能にします。また、NeMo Retriever NIM マイクロサービスにより、開発者はデータによって強化されたこれらすべてのメリットを享受できます。

以下の新しい NeMo Retriever と埋め込みおよび再ランク付け NIM マイクロサービスが一般提供されました:

NV-EmbedQA-E5-v5 ……テキスト質問応答検索に最適化された人気のコミュニティベース埋め込みモデル
NV-EmbedQA-Mistral7B-v2 ……高精度質問応答のためのテキスト埋め込み用にファインチューニングされた人気の多言語コミュニティベースモデル
Snowflake-Arctic-Embed-L ……最適化されたコミュニティモデル
NV-RerankQA-Mistral4B-v3 ……高精度質問応答のためのテキスト再ランク付け用にチューニングされた人気のコミュニティベースモデル

これらは、NVIDIA API カタログから簡単にアクセスできる NIM マイクロサービスのコレクションに加わります。

埋め込みモデルと再ランク付けモデル

NeMo Retriever NIM マイクロサービスは、埋め込みと再ランク付けの 2 つのモデルタイプで構成され、透明性と信頼性を保証するオープンおよび商用のサービスを備えています。

Llama 3.1 用の NVIDIA NIM マイクロサービスと、顧客サービス AI チャットボットアプリケーション用の NeMo Retriever 埋め込みおよび再ランク付け NIM マイクロサービスを使用した RAG パイプラインの例。

埋め込みモデルは、テキスト、画像、グラフ、ビデオなどの様々なデータを数値ベクトルに変換し、その意味とニュアンスを捉え、ベクトルデータベースに格納します。埋め込みモデルは高速で、従来の大規模言語モデル (LLM) よりも計算コストが低くなっています。

再ランク付けモデルは、データとクエリを取り込み、クエリとの関連性に応じてデータをスコア付けします。このようなモデルは、埋め込みモデルよりも計算が複雑で遅いものの、大幅な精度の向上を提供します。

NeMo Retriever は、両方の長所を兼ね備えています。NeMo Retriever を利用する開発者は、埋め込み NIM を使用して取得するデータの範囲を広げ、再ランク付け NIM を使用して関連性に応じて結果を絞り込むことで、企業にとって最も有用で正確な結果を保証するパイプラインを構築できます。

NeMo Retriever を使用すると、開発者は最先端のオープンおよび商用モデルにアクセスして、最高の精度を提供するテキスト Q&A 検索パイプラインを構築できます。他のモデルと比較すると、NeMo Retriever NIM マイクロサービスは企業の質問応答において、不正確な回答を 30% 削減しました。

NeMo Retriever 埋め込み NIM と埋め込み + 再ランク付け NIM マイクロサービスのパフォーマンスと、語彙検索および代替埋め込み機能との比較。

主なユースケース

RAG や AI エージェントソリューションからデータ駆動型分析等まで、NeMo Retriever は幅広い AI アプリケーションに活用されます。

このマイクロサービスは、正確でコンテキストを認識した応答を提供するインテリジェントチャットボットの構築に使用できます。また、膨大な量のデータを分析してセキュリティの脆弱性を特定することや、複雑なサプライチェーン情報から洞察を引き出すことにも有用です。また、自然でパーソナライズされたショッピング体験を提供する AI 搭載の小売ショッピングアドバイザーなど、さまざまなタスクを強化できます。

これらのユースケース向けの NVIDIA AI ワークフローは、生成AI 搭載テクノロジを開発するための簡単でサポートされた出発点を提供します。

NVIDIA のデータプラットフォームパートナー数十社が、NeMo Retriever NIM マイクロサービスと連携して、AI モデルの精度とスループットを向上させるために取り組んでいます。

DataStax は、Astra DB および Hyper-Converged プラットフォームに NeMo Retriever 埋め込み NIM マイクロサービスを統合し、正確な生成 AI で強化された RAG 機能を、より迅速な市場投入時間で顧客に提供できるようにしました。

Cohesity は、NVIDIA NeMo Retriever マイクロサービスを AI 製品である Cohesity Gaia と統合し、顧客が RAG を通じて洞察力に富んだ変革的な生成 AI アプリケーションを実現するためにデータを活用できるように支援します。

Kinetica は、NVIDIA NeMo Retriever を使用して、複雑なネットワークと自然言語で対話し、障害や侵害に迅速に対応して洞察を即時のアクションに変えることができる LLM エージェントを開発します。

NetApp は NVIDIA と連携して、NeMo Retriever マイクロサービスを同社のインテリジェントデータインフラ上のエクサバイト規模のデータに接続します。NetApp ONTAP の利用顧客は、データのセキュリティやプライバシーを犠牲にすることなく、シームレスに「データと対話」して独自のビジネスインサイトにアクセスできるようになります。

Accenture、Deloitte、Infosys、LTTS、Tata Consultancy Services、Tech Mahindra、Wipro などの NVIDIA グローバルシステムインテグレーターパートナー、およびサービス提供パートナーの Data Monsters、EXLService (Ireland) Limited、Latentview、Quantiphi、Slalom、SoftServe、Tredence は、企業が NeMo Retriever NIM マイクロサービスを AI パイプラインに追加できるように支援するサービスを開発しています。

他の NIM マイクロサービスとの併用

NeMo Retriever NIM マイクロサービスは、NVIDIA Riva NIM マイクロサービスと併用できます。NVIDIA Riva NIM マイクロサービスは、業界全体でスピーチ AI アプリケーションを強化し、顧客サービスを向上させ、デジタルヒューマンに生き生きとした動きを与えます。

Riva NIM マイクロサービスとしてまもなく利用可能になる新しいモデルには、音声合成アプリケーション用の FastPitch と HiFi-GAN、多言語ニューラル機械翻訳用の Megatron、自動音声認識用の記録を持つ NVIDIA Parakeet モデルファミリがあります。

NVIDIA NIM マイクロサービスは、すべて一緒に使用することも個別に使用することもでき、開発者に AI アプリケーションを構築するためのモジュールアプローチを提供します。さらに、マイクロサービスは、クラウド、オンプレミス、ハイブリッド環境でコミュニティモデル、NVIDIA モデル、またはユーザーのカスタムモデルと統合できるため、開発者はさらなる柔軟性が得られます。

NVIDIA NIM マイクロサービスは、ai.nvidia.com で利用可能です。企業は、NVIDIA AI Enterprise ソフトウェアプラットフォームを通じて、NIM を使用して AI アプリケーションを本番環境に展開できます。

NIM マイクロサービスは、Amazon Web Services、Google Cloud、Microsoft Azure、Oracle Cloud Infrastructure のクラウドインスタンスや、Cisco、Dell Technologies、Hewlett Packard Enterprise、Lenovo、Supermicro などのグローバルサーバー製造パートナーの NVIDIA-Certified Systems など、顧客が希望するアクセラレーテッドインフラ上で実行可能です。

NVIDIA Developer Program のメンバーは、希望するインフラ上で研究、開発、テストを行うために、まもなく NIM に無料でアクセスできるようになります。

7 月 28 日から 8 月 1 日までデンバーで開催されるプレミアコンピューターグラフィックスカンファレンス、SIGGRAPHでNVIDIA に参加して、生成 AI とアクセラレーテッドコンピューティングの最新情報を入手してください。

ソフトウェア製品の利用規約については、こちらをご覧ください。