マイクロサービスがより身近に:企業が生成 AI をより簡単に導入できるように、NVIDIA が支援
NVIDIA AI Enterprise 5.0 に推論および他のサービスのためのクラウド API を実装し、AI を活用したアプリケーションの導入を後押し
NVIDIA AI Enterprise 5.0 に推論および他のサービスのためのクラウド API を実装し、AI を活用したアプリケーションの導入を後押し
Google の新しいオープン言語モデルは、ローカルの RTX AI PC を含む NVIDIA AI プラットフォーム全体で TensorRT-LLM により高速化されます
Amazon が NVIDIA TensorRT-LLM と GPU を使用した新しい AI 機能で推論速度を 2 倍に向上させ、出品者の商品リストの最適化を高速化
Microsoft Ignite で発表された新しいツールとリソースには、OpenAI Chat API 用 のTensorRT-LLM ラッパー、Llama 2 向けの DirectML に対する RTX を利用したパフォーマンス向上、その他の一般的な LLM が含まれます
開発者は、新しい NVIDIA AI Foundation モデルをブラウザから直接試すことができ、NVIDIA AI Foundation Endpoints を使ってアプリケーションでテストした後、独自のビジネス データを使ってカスタマイズできます。
Retrieval-Augmented Generation は、外部ソースから取得した情報を用いて、生成 AI モデルの精度と信頼性を向上させるテクノロジです。