NVIDIA がエージェント型 AI を進化させる Nemotron モデル ファミリを発表

NVIDIA NIM マイクロサービスとして利用可能なオープン Llama Nemotron 大規模言語モデルと Cosmos Nemotron 視覚言語モデルが、あらゆるアクセラレーテッド システムで AI エージェントを強化可能に
投稿者: Kari Briski

人工知能は、専門のエージェントのチームが複雑な問題を解決し、反復的なタスクを自動化するのを支援できる、エージェント型 AI という新しい時代に入りつつあります。

カスタムの AI エージェントを使用すると、さまざまな業界の企業がインテリジェンスを製造し、これまでにない生産性を実現できます。これらの高度な AI エージェントには、エージェント型 AI の機能と能力に合わせて最適化された複数の生成 AI モデルのシステムが必要です。この複雑さにより、強力で効率的なエンタープライズ グレードのモデルの必要性がかつてないほど高まっています。

エンタープライズ エージェント AI の基盤を提供するために、NVIDIA は本日、オープンな大規模言語モデル (LLM) の Llama Nemotron ファミリを発表しました。Llama で構築されたモデルは、顧客サポート、不正検出、製品サプライ チェーンと在庫管理の最適化など、さまざまなアプリケーションにわたって開発者がAI エージェントを作成し、展開するのに役立ちます。

効果を発揮するには、多くの AI エージェントに言語スキルと、世界を認識して適切なアクションで応答する能力の両方が必要となります。

新しい NVIDIA Cosmos Nemotron 視覚言語モデル (VLM) と、ビデオ検索および要約用の NVIDIA NIM マイクロサービスにより、開発者は、自律マシン、病院、店舗、倉庫、スポーツ イベント、映画、ニュースからの画像やビデオを分析して応答するエージェントを構築できます。ロボティクスや自律走行車向けの物理を考慮したビデオを生成したい開発者向けに、NVIDIA は本日、NVIDIA Cosmos 世界基盤モデルを別途発表しました。

オープン Llama Nemotron モデルが AI エージェントの計算効率と精度を最適化

6 億 5,000 万回以上ダウンロードされた、最も人気のある商用利用可能なオープン ソース モデル コレクションの 1 つである Llama 基盤モデルを使用して構築された NVIDIA Llama Nemotron モデルは、AI エージェント開発用に最適化された構成要素を提供します。これは、現在 NVIDIA API カタログを通じて入手可能である Llama 3.1 Nemotron 70B のような、最先端モデルの開発に対する NVIDIA のコミットメントに基づくものです。

Llama Nemotron モデルは、強化されたエージェント機能のために、プルーニングおよびトレーニングを NVIDIA の最新技術と高品質のデータセットを用いて行っています。これらは、命令の追跡、チャット、関数の呼び出し、コーディング、および数学演算に優れており、幅広い NVIDIA アクセラレーテッド コンピューティング リソースで実行できるようにサイズが最適化されています。

Meta のバイス プレジデント兼 GenAI 責任者である Ahmad Al-Dahel 氏は次のように述べています。「エージェント型 AI は AI 開発の次のフロンティアであり、この機会を実現するには、効率的で正確な AI エージェントを提供するために LLM システム全体にわたるフルスタックの最適化が必要です。NVIDIA とのコラボレーションとオープン モデルへの共通の取り組みにより、Llama 上に構築された NVIDIA Llama Nemotron ファミリは、企業が独自のカスタム AI エージェントを迅速に作成するのに役立ちます」

SAP や ServiceNow などの主要な AI エージェント プラットフォーム プロバイダーは、新しい Llama Nemotron モデルを最初に使用する企業の 1 つになる見込みです。

SAP の最高 AI 責任者である Philipp Herzig 氏は次のように述べています。「複数の事業部門にまたがる複雑なタスクを解決するために連携する AI エージェントは、今日の生成 AI シナリオを超えた、まったく新しいレベルの企業生産性を実現するでしょう。SAP の Joule を通じて、何億人もの企業ユーザーがこれらのエージェントと対話し、かつてない速さで目標を達成します。NVIDIA の新しいオープン Llama Nemotron モデル ファミリは、ビジネス プロセスを変革する複数の特殊な AI エージェントの開発を促進することでしょう」

ServiceNow のプラットフォーム AI 担当副社長、Jeremy Barnes 氏は次のように述べています。「AI エージェントにより、組織はより少ない労力でより多くの成果を達成できるようになり、ビジネス変革の新たな基準が確立されます。NVIDIA のオープン Llama Nemotron モデルのパフォーマンスと精度の向上により、あらゆる業界の機能にわたる複雑な問題を解決する高度な AI エージェント サービスが構築できるのです」

NVIDIA Llama Nemotron モデルは、蒸留、プルーニング、アラインメントに NVIDIA NeMo を活用します。これらの技術を使用することで、モデルはさまざまなコンピューティング プラットフォームで実行できるほど小さくなり、高い精度とモデル スループットの向上が実現します。

Llama Nemotron モデル ファミリは、ダウンロード可能なモデルとして、またクラウド、データセンター、PC、ワークステーションに簡単に展開できる NVIDIA NIM マイクロサービスとして提供されます。これらのモデルは、信頼性が高く、安全で、エージェント型 AI アプリケーション ワークフローにシームレスに統合され、業界をリードするパフォーマンスを企業に提供します。

NVIDIA NeMo でビジネス ナレッジをカスタマイズして接続

Llama Nemotron および Cosmos Nemotron モデル ファミリは Nano、Super、Ultra のサイズで提供され、あらゆる規模で AI エージェントを展開するためのオプションを提供します。

  • Nano: 低遅延のリアルタイム アプリケーション向けに最適化された最もコスト効率の高いモデルで、PC やエッジ デバイスへの展開に最適です。
  • Super: 単一の GPU で優れたスループットを提供する高精度モデルです。
  • Ultra: 最高のパフォーマンスを要求するデータセンター規模のアプリケーション向けに設計された最高精度のモデルです。

企業は、NVIDIA NeMo マイクロサービスを使用して、特定のユースケースやドメインに合わせてモデルをカスタマイズし、データ キュレーションを簡素化し、モデルのカスタマイズと評価を加速し、ガードレールを適用して応答を順調に進めることもできます。

NVIDIA NeMo Retriever を使用すると、開発者は検索拡張生成 (RAG) 機能を統合して、モデルをエンタープライズ データに接続することもできます。

また、エージェント型 AI 用NVIDIA Blueprint を使用すると、企業は NVIDIA の高度な AI ツールとエンドツーエンドの開発専門知識を使用して、独自のアプリケーションをすばやく作成できます。実際、NVIDIA Cosmos Nemotron、NVIDIA Llama Nemotron、および NeMo Retriever は、本日別途発表されたビデオ検索および要約用の新しい NVIDIA Blueprint を強化します。

NeMo、NeMo Retriever、および NVIDIA Blueprint はすべて、NVIDIA AI Enterprise ソフトウェア プラットフォームで利用できます。

提供予定

Llama Nemotron および Cosmos Nemotron モデルは、まもなく、ホストされた API として、および build.nvidia.com および Hugging Face からダウンロードしてご利用いただけます。NVIDIA Developer Program のメンバーは、開発、テスト、研究のためのアクセスが無料です。

企業は、アクセラレーテッド データセンターとクラウド インフラ上の NVIDIA AI Enterprise ソフトウェア プラットフォームを使用して、Llama Nemotron および Cosmos Nemotron NIM マイクロサービスを本番環境で実行できます。

Llama Nemotron および Cosmos Nemotron モデルに関する最新情報を申請して受け取りましょう。また、NVIDIA の創業者/CEO であるジェンスン フアン (Jensen Huang) のCES オープニング基調講演のリプレイはこちらから視聴できます。

ソフトウェア製品情報についてのお知らせはこちらをご覧ください。