TensorRT Archives - NVIDIA | Japan Blog

高速かつ低コストの推論が、収益性の高い AI の鍵となる

AWS 上の NVIDIA NIM が AI 推論を強化

NVIDIA、日本で生成 AI 向け NIM マイクロサービスを開始

Gemma、NIM と出会う: NVIDIA と Google DeepMind がタッグを組んで大規模言語モデルのイノベーションを推進

さらにオープンに：NVIDIA、Meta Llama 3 での推論を高速化

小型であるが強力: NVIDIA が Microsoft の Phi-3 Mini オープン言語モデルを高速化

AIを活用した内視鏡で医師が腸の健康状態を詳しく観察

NVIDIA Hopper が MLPerf ベンチマークで生成 AI をリード

マイクロサービスがより身近に：企業が生成 AI をより簡単に導入できるように、NVIDIA が支援