Category: Deep Learning
未来に火をつける: TensorRT-LLM が AI 推論のパフォーマンスを加速し、RTX を搭載した Windows 11 PC 上で動作する新しいモデルのサポートを追加
Microsoft Ignite で発表された新しいツールとリソースには、OpenAI Chat API 用 のTensorRT-LLM ラッパー、Llama 2 向けの DirectML に対する RTX を利用したパフォーマンス向上、その他の一般的な LLM が含まれます
Retrieval-Augmented Generation (RAG) とは?
Retrieval-Augmented Generation は、外部ソースから取得した情報を用いて、生成 AI モデルの精度と信頼性を向上させるテクノロジです。
NVIDIA、MLPerf ベンチマークで生成 AI トレーニングを飛躍的に加速
NVIDIA H100 Tensor コア GPU は、前例のないスケーリングとソフトウェアの進歩により、最新の業界標準テストで新記録を樹立
AI スーパーコンピューターが英国の経済エンジンを回す
英国で最も強力なスーパーコンピューターが NVIDIA Grace Hopper Superchip を使用して、機械学習における世界的な野望を実現
NVIDIA AI が Oracle Cloud Marketplace で利用可能に
業界初、OCI が NVIDIA DGX Cloud AI スーパーコンピューティング プラットフォームと NVIDIA AI Enterprise ソフトウェアへの企業アクセスを拡大