NVIDIA、Rubin CPX を発表: 大規模コンテキスト推論向けに設計された新しいクラスの GPU

投稿者: NVIDIA Japan
  • NVIDIA Rubin CPX GPU は、数百万トークン単位のコーディングや生成ビデオ アプリケーションを処理するために特別に設計されています。
  • NVIDIA Vera Rubin NVL144 CPX プラットフォームは、8 エクサフロップスの AI パフォーマンスと 100TB の高速メモリを単一のラックに搭載しています。
  • Cursor、Runway、Magic などの AI イノベーターは、Rubin CPX を活用した自社アプリケーションの高速化を模索しています。

【プレス リリース】カリフォルニア州サンタクララ — AI Infra Summit — 2025 年 9 月 9 日— NVIDIA® は本日、大規模コンテキスト処理向けに設計された新しいクラスの GPU である NVIDIA Rubin CPX を発表しました。これにより、AI システムは数百万トークンにおよぶソフトウェア コーディングや生成ビデオを革新的なスピードと効率で処理できるようになります。

Rubin CPX は、新しい NVIDIA Vera Rubin NVL144 CPX プラットフォーム内で NVIDIA Vera CPU および Rubin GPU と連携して動作します。この統合された NVIDIA MGX システムは、8 エクサフロップスの AI コンピューティングを搭載し、NVIDIA GB300 NVL72 システムと比較して 7.5 倍の AI パフォーマンスを発揮します。また、100TB の高速メモリと毎秒 1.7 ペタバイトのメモリ帯域幅を単一のラックで実現します。既存のVera Rubin 144システムの再利用を検討している顧客向けに、専用のRubin CPXコンピューティングトレイも提供されます。

NVIDIA の創業者/CEO の Jensen Huang (ジェンスン フアン) は次のように述べています。「Vera Rubin プラットフォームは、次世代の Rubin GPU と、CPX と呼ばれる新しいカテゴリーのプロセッサの両方を導入し、AI コンピューティングの最前線におけるさらなる飛躍をもたらすでしょう。RTX がグラフィックスとフィジカル AI に革命をもたらしたように、Rubin CPX は大規模コンテキスト AI 向けに設計した初の CUDA GPU であり、モデルは数百万トークンに及ぶ知識を一度に推論します」

NVIDIA Rubin CPX は、長文コンテキスト処理において最高のパフォーマンスとトークン収益を可能にします。これは、現在のシステムが処理できるように設計された能力をはるかに超えています。これにより、AI コーディング アシスタントは単純なコード生成ツールから、大規模なソフトウェア プロジェクトを理解し、最適化できる高度なシステムへと生まれ変わります。

ビデオ処理の場合、AI モデルは 1 時間のコンテンツの処理には最大 100 万トークンが必要であり、これは従来の GPU コンピューティングの限界を超えています。Rubin CPX は、ビデオのデコーダーとエンコーダー、長文のコンテキスト推論処理を単一のチップに統合し、ビデオ検索や高品質な生成ビデオなどのロング フォーマットのアプリケーションで前例のない能力を発揮します。

NVIDIA Rubin アーキテクチャを基盤とする Rubin CPX GPU は、費用対効果に優れたモノリシック ダイ設計を採用しており、強力な NVFP4 コンピューティング リソースを搭載し、AI 推論タスクにおいて極めて高いパフォーマンスとエネルギー効率を実現するよう最適化されています。

Rubin CPX による進歩

Rubin CPX は、NVFP4 精度で最大 30 ペタフロップスのコンピューティング能力を実現し、最高のパフォーマンスと精度を発揮します。費用対効果の高い 128GB の GDDR7 メモリを搭載し、最も要求の厳しいコンテキストベースのワークロードを高速化します。さらに、NVIDIA GB300 NVL72 システムと比較して 3 倍高速なアテンション機能を提供し、速度を落とすことなく AI モデルの長文コンテキスト シーケンスの処理能力を向上させます。

Rubin CPX は、Vera Rubin NVL144 CPX を含む複数の構成で提供され、NVIDIA Quantum‑X800 InfiniBand スケールアウト コンピューティング ファブリックや、NVIDIA Spectrum-XGS Ethernet テクノロジおよび NVIDIA ConnectX®-9 SuperNIC™ を備えた NVIDIA Spectrum-X™ Ethernet ネットワーキング プラットフォームと組み合わせることができます。

業界リーダーが Rubin CPX に注目

AI イノベーターは、大規模なソフトウェア開発から動的なビジュアル コンテンツの分析、ビデオ理解の深化に至るまで、Rubin CPX がどのように自社のアプリケーションを高速化できるかを探求しています。

Cursor は AI を活用したソフトウェア企業であり、高度なコード エディタを提供しており、コーディング環境で直接利用できるインテリジェントなコード生成とコラボレーション ツールによって、Rubin CPX が開発者の生産性を向上させる利点に注目しています。

「NVIDIA Rubin CPX により、Cursor が超高速のコード生成と開発者のインサイトを提供できるようになることは、ソフトウェア開発に変革をもたらします」と、Cursor の CEO である Michael Truell 氏は述べています。「これにより、生産性が新たなレベルに向上し、ユーザーがこれまで実現不可能だったアイデアを迅速に実現できるようになります」

米国の生成 AI 企業である Runway は、NVIDIA のテクノロジを活用し、クリエイターがかつてない規模と効率で、映画のようなコンテンツや高度な視覚効果を制作できるようにします。

Runway の CEO である Cristóbal Valenzuela 氏は次のように述べています。「ビデオ生成は、より長いコンテキストと、より柔軟なエージェント駆動型のクリエイティブ ワークフローへと急速に進化しています。Rubin CPX は、パフォーマンスの大きな飛躍であり、より汎用的でインテリジェントなクリエイティブ ツールを構築するための要求の厳しいワークロードを支援します。つまり、独立系アーティストから大手スタジオまで、クリエイターは自信の作品に前例のないスピード、リアリズム、コントロールを取り入れることができるようになります」

Magic は、ソフトウェア エンジニアリングを自動化できる AI エージェントの基盤モデルを開発する、AI の研究および製品販売を専門とする企業です。

Magic の CEO である Eric Steinberger 氏は次のように述べています。「1 億トークンからなるコンテキスト ウィンドウにより、当社のモデルは、ファインチューニングなしに、コードベース、長年にわたる対話履歴、ドキュメント、ライブラリをコンテキスト内で認識できます。これにより、ユーザーがテスト時に会話と環境へのアクセスを通じて、エージェントをコーチングすることが可能になり、自律型のエージェント体験の実現により近づきます。NVIDIA Rubin CPX などの GPU を活用することで、コンピューティング ワークロードを大幅に高速化できます」

ソフトウェア サポート

NVIDIA Rubin CPX は、アクセラレーテッド インフラからエンタープライズ対応ソフトウェアに至るまで、NVIDIA AI スタック全体によってサポートされます。NVIDIA Dynamo プラットフォームは、AI 推論を効率的に拡張し、スループットを劇的に向上させるとともに、応答時間とモデルの提供コストを削減します。

これらのプロセッサは、エンタープライズ対応の AI エージェント向けに最先端のリーズニングを提供する NVIDIA Nemotron™ ファミリーの最新のマルチモーダル モデルを実行することができます。本番稼働グレードの AI として、Nemotron モデルは NVIDIA NIM™ マイクロサービス、ライブラリ、ツールを含むソフトウェア プラットフォームである NVIDIA AI Enterprise と共に提供され、企業は NVIDIA が高速化するクラウド、データセンター、ワークステーションに展開できます。

数十年にわたるイノベーションを基盤に構築された Rubin プラットフォームは、NVIDIA CUDA‑X™ ライブラリ、600 万人を超える開発者のコミュニティ、約 6,000 の CUDA アプリケーションからなる、NVIDIA の開発者エコシステムを拡張します。

提供時期

NVIDIA Rubin CPX は、2026 年末に発売される予定です。

詳細については、9 月 9 日午前 10 時 (太平洋標準時) に開催される AI Infra Summit での NVIDIA のハイパースケールおよび HPC 担当バイス プレジデントの Ian Buck (イアン バック) による基調講演をご覧ください。

NVIDIAについて
NVIDIA (NASDAQ: NVDA) はアクセラレーテッド コンピューティングの世界的なリーダーです。

Vera Rubin システムは引き続き驚異的なパフォーマンスと効率性を提供していること、Rubin CPX により数百万トークン単位のコンテキスト処理に適した GPU を構築し推論コストを削減することで世界中の開発者やクリエイター向けの先進的な技術を活用できること、NVIDIA の製品、サービスおよび技術の利点、影響、パフォーマンスおよび可用性、NVIDIA の提携企業やパートナーを含む第三者との取り決めに関する期待、技術開発に対する期待。また、歴史的事実ではないその他の記述は、1933 年証券法第 27A 条 (改正後) および1934 年証券取引法第 21E 条 (改正後) に定義される将来の見通しに関する記述であり、経営陣の信念と仮定、および経営陣が現在入手できる情報に基づいて設定した「セーフハーバー」の対象であり、リスクと不確実性に左右されるため、結果が予想と大きく異なる可能性があります。実際の結果を大きく変化させる可能性がある重要な要因には、世界経済の状況と政治情勢、NVIDIA の製品の製造、組み立て、梱包、テストにおける第三者への依存、技術開発と競争の影響、新製品・技術の開発または NVIDIA の既存製品・技術の改良、NVIDIA 製品または NVIDIA パートナー製品の市場での受け入れられ方、設計、製造またはソフトウェア上の欠陥、消費者の嗜好や需要の変化、業界標準やインターフェースの変更、NVIDIA の製品または技術をシステムに統合した場合の予期しない性能の低下、適用される法規制の変更、NVIDIA が証券取引委員会 (SEC) に提出する年次報告書 (Form 10-K) や四半期報告書 (Form 10-Q) を含むがこれらに限定されない最新の報告書に随時詳述されているその他の要因などがあります。SEC に提出された報告書のコピーは、会社のウェブサイトに掲載され、NVIDIA から無料で入手できます。 これらの将来の見通しに関する記述は、将来の業績を保証するものではなく、本プレス リリースの日付の時点での見解です。また、法律で義務付けられる場合を除き、NVIDIA は、将来の出来事や状況を反映するためにこれらの将来の見通しに関する記述を更新する義務を一切負いません。

本リリースに記載されている製品や機能の多くはまだ様々な段階にあり、利用可能になった時点で提供される予定です。記述は、コミットメント、約束、または法的義務として意図されたものではなく、またそう解釈されるべきでもありません。また、NVIDIA製品について説明された特徴や機能の開発、リリース、および時期は変更される可能性があり、NVIDIA単独の裁量に委ねられます。NVIDIAは、ここに記載された製品、特徴または機能の不提供または遅延について、いかなる責任も負いません。

© 2025 NVIDIA Corporation. All rights reserved. NVIDIA、NVIDIA ロゴ、米国およびその他の国における NVIDIA Corporation の商標および/または登録商標です。 その他の会社名および製品名は、それぞれの会社の商標である場合があります。機能、価格、発売状況、仕様は予告なしに変更される場合があります。