未来に火をつける: TensorRT-LLM が AI 推論のパフォーマンスを加速し、RTX を搭載した Windows 11 PC 上で動作する新しいモデルのサポートを追加
Microsoft Ignite で発表された新しいツールとリソースには、OpenAI Chat API 用 のTensorRT-LLM ラッパー、Llama 2 向けの DirectML に対する RTX を利用したパフォーマンス向上、その他の一般的な LLM が含まれます
Microsoft Ignite で発表された新しいツールとリソースには、OpenAI Chat API 用 のTensorRT-LLM ラッパー、Llama 2 向けの DirectML に対する RTX を利用したパフォーマンス向上、その他の一般的な LLM が含まれます
Microsoft Azure 上でホストされる仮想工場と自律走行車のシミュレーション エンジンが、自動車の設計、製造、運用を迅速に行うことが可能に
開発者は、新しい NVIDIA AI Foundation モデルをブラウザから直接試すことができ、NVIDIA AI Foundation Endpoints を使ってアプリケーションでテストした後、独自のビジネス データを使ってカスタマイズできます。
Retrieval-Augmented Generation は、外部ソースから取得した情報を用いて、生成 AI モデルの精度と信頼性を向上させるテクノロジです。
世界最大の化学会社は、NVIDIA ソフトウェアと GPU を活用したハイブリッド量子コンピューティングによる洞察を求めている多くの組織の 1 つです。
GH200 を搭載するセンターが、合計 200 エクサフロップスの AI パフォーマンスを提供して科学革新を推進