NVIDIA、企業向けカスタム生成 AI モデル開発を高速化

投稿者: Erik Pounds

開発者は、新しい NVIDIA AI Foundation モデルをブラウザから直接試すことができ、NVIDIA AI Foundation Endpoints を使ってアプリケーションでテストした後、独自のビジネス データを使ってカスタマイズできます。

今日、無料でオープンソースの大規模言語モデル (LLM) は、企業にとって食べ放題のビュッフェのようなものです。カスタム生成 AI アプリケーションを構築する開発者は、互換性、セキュリティ、モデルをトレーニングしたデータなど、独自のプロジェクト要件やビジネス要件をナビゲートする必要があるため、この豊富さに圧倒されることがあります。

NVIDIA AI Foundation モデル は、エンタープライズグレードの事前トレーニング済みモデルを集めたもので、開発者はエンタープライズ アプリケーション用のカスタム生成 AI モデルから始めることができます。

NVIDIA に最適化された基盤モデルがイノベーションを加速

NVIDIA AI Foundation モデルは、シンプルなユーザー インターフェイスまたは API を通じて、ブラウザから直接体験することができます。さらに、これらのモデルは NVIDIA AI Foundation Endpoints からアクセスし、企業のアプリケーション内からモデルのパフォーマンスをテストすることが可能です。

モデルには、Llama 2、Stable Diffusion XL、Mistral などの主要なコミュニティ モデルが含まれており、開発者が独自データによるカスタマイズを効率化できるようにフォーマットされています。さらに、モデルは NVIDIA TensorRT-LLM で最適化されており、最高のスループットと最小のレイテンシを実現し、NVIDIA GPU アクセラレーション スタック上でスケーラブルに動作します。例えば、TensorRT-LLM で最適化された Llama 2 モデルは、NVIDIA H100 上で 2 倍近く高速に動作します。

また、新しい NVIDIA ファミリの Nemotron-3 8B モデルは、ヘルスケア、通信、金融サービスを含む幅広い業界向けに、今日の最先端のエンタープライズ チャットおよび Q&A アプリケーションの作成をサポートします。

このモデルは、安全で実運用可能な生成 AI アプリケーションを構築するお客様の起点となるもので、責任を持って提供されたデータセットでトレーニングされており、より大規模なモデルに匹敵するパフォーマンスで動作するため、企業での導入に最適です。

多言語機能は Nemotron-3 8B モデルの主要な差別化要因です。そのままの状態で、英語、ドイツ語、ロシア語、スペイン語、フランス語、日本語、中国語、韓国語、イタリア語、オランダ語を含む 50 以上の言語に対応しています。

カスタマイズから展開までを迅速化

ビジネス全般に渡り、生成 AI を活用する企業には、独自のアプリケーション向けにモデルをカスタマイズするための AI ファウンドリが必要です。NVIDIA の AI ファウンドリは、NVIDIA AI Foundation モデル、NVIDIA NeMo フレームワークとツール、NVIDIA DGX Cloud AI スーパーコンピューティング サービスという 3 つの要素を備えています。これらを組み合わせることで、カスタムの生成 AI モデルを作成するためのエンドツーエンドの企業向けサービスを提供します。

重要なことは、企業はモデルをカスタマイズしたら、NVIDIA AI Enterprise ソフトウェアを使用して、エンタープライズグレードのセキュリティ、安定性、サポートを備えたアクセラレーテッド コンピューティング上のどこにでも展開することができるということです。

利用方法

NVIDIA AI Foundation モデルは、NVIDIA NGC カタログと Hugging Face から自由に体験できます。また、Microsoft Azure AI モデル カタログでもホストされています。