NVIDIA、あらゆる業界で AI を推進する新しいオープン モデル、データ、ツールを発表

投稿者: Kari Briski

NVIDIA は本日、オープン モデルの領域を拡大し、あらゆる業界で AI を進化させるための新たなオープン モデル、データ、ツールを発表しました。

これらのモデルは、エージェント型 AI 向けの NVIDIA Nemotron ファミリー、フィジカル AI 向けの NVIDIA Cosmos プラットフォーム、自動運転車開発向けの新しい NVIDIA Alpamayo ファミリー、ロボティクス向けの NVIDIA Isaac GR00T、バイオメディカル向けの NVIDIA Clara を網羅しており、企業が現実世界の AI システムを開発するためのツールを提供します。

NVIDIA は、オープンソースのトレーニング フレームワークと、10 兆個の言語トレーニング トークン、50 万ものロボット軌跡、45 万 5000 件のタンパク質構造、100 テラバイトにのぼる車両センサー データなど、世界最大級のオープン マルチモーダル データ コレクションを提供しています。これは、言語、ロボット、科学研究、自動運転車におけるイノベーションを加速するための、かつてない規模の多様なオープン リソースです。

Bosch、CodeRabbit、CrowdStrike、Cohesity、Fortinet、Franka Robotics、Humanoid、Palantir、Salesforce、ServiceNow、日立、Uber といった主要なテクノロジ企業が、NVIDIA のオープンモデル テクノロジを採用し、その技術を基盤として開発を進めています。

NVIDIA Nemotron が AI エージェントに音声、マルチモーダル インテリジェンス、そして安全性を提供

NVIDIA は、最近リリースした NVIDIA Nemotron 3 ファミリーのオープン モデルとデータに基づき、音声、マルチモーダル検索拡張生成 (RAG)、そして安全性のための新たな Nemotron モデルをリリースします。

  • Nemotron Speech は、ライブ キャプションや音声 AI アプリケーション向けに、リアルタイムで低遅延の音声認識を実現する、新しい ASR モデルを含む、リーダーボードで上位にランクインしたオープン モデルで構成されています。Daily ベンチマークと Modal ベンチマークでは、このモデルが同クラスの他のモデルと比較して 10 倍高速なパフォーマンスを発揮することが示されています。
  • Nemotron RAG は、新しい埋め込みおよび再ランク付け機能を備えたビジョン言語モデル (VLM) で構成されており、高精度な多言語およびマルチモーダルなデータ インサイトを提供することで、ドキュメント検索と情報検索を強化します。
  • AI アプリケーションの安全性と信頼性を強化する Nemotron Safety モデルには、拡張された言語サポートを備えた Llama Nemotron Content Safety モデルと、機密データを高精度に検出する Nemotron PII が新たに含まれています。

Bosch は、ドライバーと車両とのインタラクションを可能にするため、Nemotron Speech を採用しています。ServiceNow は、コスト効率の高いマルチモーダル パフォーマンスを実現するために、Nemotron を含むオープン データセットで Apriel モデル ファミリーをトレーニングしています。

Cadence と IBM は、複雑な技術文書全体の検索とリーズニングを向上させるため、NVIDIA Nemotron RAG モデルの試験運用を行っています。

CrowdStrike、Cohesity、Fortinet は、AI アプリケーションの信頼性を強化するため、NVIDIA Nemotron Safety モデルを採用しています。

Palantir は、Nemotron モデルを自社の Ontology フレームワークに統合し、特化型 AI エージェント向けの初の統合テクノロジ スタックを構築しています。CodeRabbit は、Nemotron モデルを使用して AI コード レビューを強化および拡張し、高いレビュー精度を維持しながら、スピードとコスト効率を向上させています。

NVIDIA は、MMTEB リーダーボードに掲載されている Llama Embed Nemotron 8B モデルのデータセット トレーニング コードを含む、オープンソースのデータセット、トレーニング リソース、ブループリントを開発者向けに公開しています。これは、AI リクエストをジョブに最適なモデルに自動的に誘導する方法を開発者に示す更新版 LLM Router と、新しい Nemotron Speech ASR モデルの構築に使用されたデータセットに加えて提供されます。

あらゆる種類のフィジカル AI とロボットに対応する新モデル

ロボットや自律システム向けのフィジカル AI を開発するには、複雑な現実世界の環境を認識、リーズニング、行動できる大規模で多様なデータセットとモデルが必要です。Hugging Faceプラットフォームにおいて、ロボティクスは最も急速に成長している分野であり、NVIDIAのオープンなロボティクス モデルとデータセットがプラットフォームのダウンロードを牽引しています

NVIDIA は、人間のようなリーズニングと世界生成機能を備え、フィジカル AI の開発と検証を加速する NVIDIA Cosmos オープン世界基盤モデルをリリースします。

NVIDIA は、Cosmos 上に構築された各フィジカル AI の実装向けに、オープン モデルとブループリントも公開しています。

  • Isaac GR00T N1.6 は、ヒューマノイド ロボット向けに特別に構築されたオープンなリーズニング視覚言語アクション (VLA) モデルです。全身制御を可能にし、NVIDIA Cosmos Reason を活用してリーズニングとコンテキスト理解を向上させます。
  • NVIDIA Metropolis プラットフォームの一部であるビデオ検索および要約のための NVIDIA Blueprint は、大量の録画ビデオやライブ ビデオを分析して運用効率と公共の安全を向上させる視覚 AI エージェントを構築するためのリファレンス ワークフローです。

SalesforceMilestone、日立、Uber、VAST DataEncord は、交通情報と職場の生産性向上のための AI エージェントに Cosmos Reason を使用しています。Franka Robotics、Humanoid、NEURA Robotics は、Isaac GR00T を活用して、本番環境に拡張する前段階でロボットの新しい動作をシミュレーション、トレーニング、検証しています。

リーズニング ベースの自動運転車向け NVIDIA Alpamayo

安全でスケーラブルな運用が可能な自動運転車の開発には、複雑な現実世界の環境において認識、リーズニング、行動できる AI システムが必要です。

NVIDIA は、リーズニング ベースの自動運転車開発を推進するためのオープン モデル、シミュレーション ツール、大規模データセットの新しいファミリーである NVIDIA Alpamayo をリリースしました。これには以下のものが含まれます。

  • Alpamayo 1:初のオープンで大規模な自動運転車 (AV) 向けのリーズニング VLA モデル であり、車両が周囲の状況を理解し、自らの行動を説明できるようにします。
  • AlpaSim:多様な環境とエッジ ケースにわたってリーズニング ベースの AV モデルのクローズド ループ トレーニングと評価を可能にする、オープンソースのシミュレーション フレームワークです。

NVIDIA はまた、Physical AI Open Dataset もリリースします。これには、広範囲な地域と条件下で収集された 1,700 時間以上の走行データが含まれ、リーズニング アーキテクチャの進化に不可欠な、稀で複雑な実世界のエッジ ケースを網羅しています。

ヘルスケアとライフ サイエンス向けの NVIDIA Clara

コストを削減し、より迅速に治療を提供するため、NVIDIA はデジタルな発見と現実世界の医療のギャップを埋める新しい Clara AI モデルを発表します。

研究者がより安全で効果的、かつ容易に製造できる治療法を設計できるよう支援するこれらのモデルには、以下のものが含まれます。

  • La-Proteina は、研究や医薬品候補開発のための原子レベルの精密な巨大なタンパク質の設計を可能にし、これまで治療不可能と考えられていた疾患を研究するための新たなツールを科学者に提供します。
  • ReaSyn v2 は、製造ブループリントを創薬プロセスに組み込むことで、AI 設計の医薬品の合成を容易にします。
  • KERMT は、候補薬が人体とどのように相互作用するかを予測することで、開発初期段階で高精度な計算安全性試験を提供します。
  • RNAPro は、RNA 分子の複雑な 3D 形状を予測することで、個別化医療の可能性を解き放ちます。

さらに、45 万 5,000 件の合成タンパク質構造からなる NVIDIA データセット は、AI 研究者がより正確な AI モデルを構築するのに役立ちます。

NVIDIA オープン モデルとテクノロジを今すぐ活用

NVIDIA のオープン モデル、データ、フレームワークは、GitHub、Hugging Face、そしてさまざまなクラウド、推論および AI インフラ プラットフォーム、そして build.nvidia.com から利用可能であり、開発者はサポート リソースに柔軟にアクセスできます。

これらのモデルの多くは、NVIDIA NIM マイクロサービスとしても提供されており、エッジからクラウドまで、あらゆる NVIDIA アクセラレーテッド インフラに安全かつスケーラブルに展開できます。

CES での NVIDIA Live で詳細をご覧ください。