TensorRT | NVIDIA

マイクロサービスがより身近に：企業が生成 AI をより簡単に導入できるように、NVIDIA が支援

by Anne Hecht / 3 Apr, 2024

NVIDIA AI Enterprise 5.0 に推論および他のサービスのためのクラウド API を実装し、AI を活用したアプリケーションの導入を後押し

by Ankit Patel / 6 Mar, 2024

Google の新しいオープン言語モデルは、ローカルの RTX AI PC を含む NVIDIA AI プラットフォーム全体で TensorRT-LLM により高速化されます

by Fred Oh / 31 Jan, 2024

Amazon が NVIDIA TensorRT-LLM と GPU を使用した新しい AI 機能で推論速度を 2 倍に向上させ、出品者の商品リストの最適化を高速化

by Jesse Clayton / 17 Nov, 2023

Microsoft Ignite で発表された新しいツールとリソースには、OpenAI Chat API 用のTensorRT-LLM ラッパー、Llama 2 向けの DirectML に対する RTX を利用したパフォーマンス向上、その他の一般的な LLM が含まれます

by Rick Merritt / 17 Nov, 2023

Retrieval-Augmented Generation は、外部ソースから取得した情報を用いて、生成 AI モデルの精度と信頼性を向上させるテクノロジです。