NVIDIA CEO が全業界向けの 生成 AI プラットフォームを発表

投稿者: Rick Merritt

COMPUTEX の基調講演では、現代で最も革新的なテクノロジである生成 AI を活用するための新しいシステム、ソフトウェア、サービスを紹介、その多くが Grace Hopper Superchipを搭載

NVIDIA の創業者/CEO であるジェンスン フアン (Jensen Huang) は、パンデミック以来初のライブ基調講演で、台北での COMPUTEX カンファレンスのオープニングを飾りました。広告から製造、通信に至るまであらゆる業界を変革する歴史的な生成 AI の波に企業が乗るために使用できるプラットフォームを発表しました。

過去数年の間、一部は自宅のキッチンからも行ったバーチャル基調講演を終えて、フアンは「戻ってきました」と第一声を上げながら登壇しました。「私はほぼ 4 年間、公の場でスピーチを行っていないので、うまくできるか心配です!」

フアンは、約 3,500 人の満員の聴衆を前に 2 時間近く講演を行いました。新しいビジネス モデルを実現し、現在のビジネスモデルもより効率的にするアクセラレーテッド コンピューティング サービス、ソフトウェア、およびシステムについて説明しました。

「アクセラレーテッド コンピューティングと AI は、コンピューティングにおける再発明を示しています」 とフアンは語りました。フアンのこの1 週間の故郷での様子は、地元メディアに毎日報道されています。

再発明の威力を実証するため、フアンは背にした巨大な 8K のディスプレイに、カラオケの曲と同じように歌うことができる、自身の基調講演のテーマソングを生成するテキストプロンプトを表示しました。フアンは時折、母国語である台湾語で観衆に語りかけながら、束の間、聴衆を先導してこの新しい歌を口ずさんでみせました。

「私たちは現在、世界中のほぼすべてのコンピューティングおよびクラウド企業に採用されているアクセラレーテッド コンピューティングと AI による、新しいコンピューティング時代の転換点にいます」とフアンは語ります。現在 4万 社の大企業と 1万5千社のスタートアップ企業が NVIDIA テクノロジを使用しており、昨年だけでもCUDA ソフトウェアが2,500万回ダウンロードされていると説明しました。


基調講演のトップニュース


エンタープライズ AI の新しいエンジン

究極の AI パフォーマンスを必要とするエンタープライズ向けに、フアンは、大規模メモリの AI スーパーコンピューターである DGX GH200 を発表しました。 NVIDIA NVLink を使用して、最大 256 基の NVIDIA GH200 Grace Hopper Superchipを結合し、単一のデータセンター規模の GPUとして実行可能にします。

フアンによると、GH200 Superchipは 現在量産段階にあり、エネルギー効率の高い NVIDIA Grace CPU と高性能な NVIDIA H100 Tensor コア GPUが 1 つのスーパーチップに組み合わされています。

DGX GH200 は、1エクサフロップスのパフォーマンスと 144 テラバイトの共有メモリを搭載しており、これは1台の NVIDIA DGX A100 320GB システムと比べて、約 500 倍以上の性能をもたらします。 これにより、開発者は、生成 AI チャットボット用の大規模な言語モデルレコメンダー システム用の複雑なアルゴリズム、不正検出やデータ分析に使用されるグラフ ニューラル ネットワークを構築できるようになります。

Google Cloud、Meta、Microsoft は、将来のハイパースケール生成 AI インフラストラクチャの青写真として使用できる DGX GH200 を活用予定の最初の企業の1つです。


NVIDIAのAIスーパーコンピュータ、DGX GH200は、生成AI向けに1エクサフロップの性能を提供。

「DGX GH200 AI スーパーコンピューターは、NVIDIA の最先端のアクセラレーテッド コンピューティングとネットワーキング テクノロジを統合して、AI のフロンティアを拡大します」と、開場前からホールの外で何時間も並んでいた台北の観客にフアンは語りかけました。

NVIDIA は独自の大規模 AI スーパーコンピューター、 NVIDIA Helios を構築しており、今年中に稼働予定です。 NVIDIA Quantum-2 InfiniBand ネットワーキングとリンクされた 4 台の DGX GH200 システムを使用して、大規模な AI モデルをトレーニングするためのデータ スループットを強化します。

DGX GH200 は、イベントで発表された数百のシステムの頂点を形成します。 これらのシステムが、生成 AI と高速コンピューティングを何百万ものユーザーに提供しています。

全体像に目を向けると、フアンは、NVIDIA の最新の Hopper、 Grace、Ada LovelaceBlueField アーキテクチャを搭載した 400 以上のシステム構成が市場に投入されることを発表しました。 これらは、AI、データ サイエンス、ハイ パフォーマンス コンピューティングにおける最も複雑な課題に取り組むことを目的としています。

あらゆるサイズでのアクセラレーション

あらゆる規模のデータセンターのニーズに適合するために、フアンは、アクセラレーテッド サーバーを構築するためのモジュラー リファレンス アーキテクチャである NVIDIA MGX を発表しました。 システム メーカーはこれを使用して、AI、HPC、NVIDIA Omniverse の幅広いアプリケーションに適合する 100 を超える異なるサーバー構成を迅速かつコスト効率よく構築できます。

MGX を使用すると、メーカーは共通のアーキテクチャとモジュール式コンポーネントを使用して CPU とアクセラレーテッド サーバーの構築が可能になります。 NVIDIA の GPU、CPU、データ プロセッシング ユニット (DPU)、ネットワーク アダプターのフルラインに加えて、さまざまな空冷および水冷シャーシでの x86 および Arm プロセッサをサポートします。

QCT と Supermicro は、MGX デザインを 8 月に初めて市場に投入します。 COMPUTEX で発表された Supermicro の ARS-221GL-NR システムは Grace CPU を搭載し、同じくイベントで発表された QCT の S74G-2U システムは Grace Hopper を搭載しています。

ASRock Rack、ASUS、GIGABYTE、Pegatron も MGX を使用して次世代アクセラレーション コンピューターを作成する予定です。

5G/6Gで求められるGrace Hopper

フアンは、NVIDIA が将来の 5G および 6G ワイヤレスおよびビデオ通信の形成に貢献していると述べました。 デモでは、Grace Hopper 上で実行される AI が、どのように今日の 2D ビデオ通話をよりリアルな 3D 体験に変換し、驚くべき臨場感を実現できるかが示されました。

新しい種類のサービスの基礎を築くにあたって、フアンは、NVIDIA が通信大手ソフトバンクと協力して日本にデータセンターの分散ネットワークを構築していると発表しました。 そこでは、5G サービスと生成 AI アプリケーションを共通のクラウド プラットフォーム上で提供する予定です。

このデータセンターは、モジュラー MGX システムの NVIDIA GH200 Superchipと NVIDIA BlueField-3 DPU、および NVIDIA Spectrum Ethernet スイッチを使用して、5G プロトコルに必要な高精度のタイミングを提供します。 このプラットフォームは、エネルギー消費を削減しながらスペクトル効率を高めることでコストを削減します。

同システムを活用して、ソフトバンクは、自動運転、AI、拡張現実と仮想現実、コンピュータービジョンおよびデジタルツインのための5G/6Gアプリケーションの実現を目指しています。

クラウドネットワークの加速

これとは別に、フアンは、イーサネットベースの AI クラウドのパフォーマンスと効率を向上させることを目的としたネットワーキング プラットフォームである NVIDIA Spectrum-X を発表しました。 Spectrum-4 イーサネット スイッチと BlueField-3 DPU およびソフトウェアを組み合わせて、従来のイーサネット ファブリックと比較して AI パフォーマンスと電力効率を 1.7 倍向上させます。

NVIDIA Spectrum-X、Spectrum-4 スイッチ、および BlueField-3 DPU は、Dell Technologies、Lenovo、Supermicro などのシステム メーカーから現在入手可能です。


NVIDIA Spectrum-X は、従来のイーサネット ネットワークではパフォーマンスの低下が発生する可能性のある AI ワークフローを高速化します。

ゲームキャラクターに命を吹き込む

生成 AI は人々の遊び方にも影響を与えます。

フアンは、開発者が音声、対話、アニメーション用のカスタム AI モデルを構築および展開するために使用できるファウンドリ サービスである、 NVIDIA Avatar Cloud Engine (ACE) for Games  を発表しました。 これにより、プレイアブルではないキャラクターに対話スキルが与えられ、進化する本物そっくりの性格で質問に応答できるようになります。

NVIDIA ACE for Games には、プレーヤーの音声を検出して書き起こすための  NVIDIA Riva などの AI 基盤モデルが含まれています。 このテキストは、NVIDIA NeMo に、NVIDIA Omniverse Audio2Faceでアニメーション化されたカスタマイズされた応答を生成するよう促します。


NVIDIA ACE for Games は、生成 AI でキャラクターに命を吹き込むためのツール チェーンを提供します。

Windows 上で 生成AI を加速

フアンは、生成 AI 時代における Windows PC のイノベーションを推進 するために、NVIDIA と Microsoft がどのように協力しているかを説明しました。

新しく強化されたツール、フレームワーク、ドライバにより、PC 開発者は AI の開発と導入が容易になります。 たとえば、GPU アクセラレーテッド AI モデルを最適化して展開するための Microsoft Olive ツールチェーンと新しいグラフィックス ドライバは、NVIDIA GPU を搭載した Windows PC での DirectML のパフォーマンスを向上させます。

このコラボレーションにより、400 を超える AI アクセラレーション Windows アプリおよびゲームのパフォーマンスを向上させる Tensor コアを搭載した RTX GPU により、1 億台の PC のインストール ベースが強化および拡張されます。

世界最大の産業のデジタル化

生成AI は、7,000 億ドル規模のデジタル広告業界にも新たな機会を生み出しています。

たとえば、世界最大のマーケティング サービス機関である WPP は、NVIDIA と協力して、Omniverse Cloud 上に世界初の生成 AI 対応コンテンツ エンジンを構築しています。

フアンはデモで、クリエイティブ チームが Adobe Substance 3D などの 3D デザイン ツールを接続して、NVIDIA Omniverse でクライアント製品のデジタル ツインを構築する方法を紹介しました。 その後、適切に調達したデータに基づいてトレーニングされ、 NVIDIA Picasso で構築された生成 AI ツールのコンテンツを使用して、仮想セットを迅速に作成できるようになります。 WPP クライアントは、完全なシーンを使用して、グローバル市場やユーザーが任意の Web デバイスで体験できるように、多数の広告、ビデオ、および 3D エクスペリエンスを生成することができます。

「今日、広告は後から取得されますが、将来的には、ユーザーが情報にアクセスすると、その多くが生成されるようになるでしょう。コンピューティング モデルが変化したのです」とフアンは述べました。

工場が AI の未来を拓く

世界中で1,000 万の工場があると推定される46 兆ドル規模の製造業界は、産業のデジタル化が大きく期待される分野です。

「世界最大の産業は物理的なものを製造しています。 それらを最初にデジタルで構築すれば、数十億ドルを節約できるでしょう」とフアンはいいます。

基調講演では、Foxconn Industrial Internet、Innodisk、Pegatron、Quanta、Wistron などのエレクトロニクス メーカーが、完全なデジタル スマート ファクトリーのビジョンを実現するために、NVIDIA テクノロジを使用してデジタル ワークフローをどのように構築しているかを紹介しました。

彼らは Omniverse と生成 AI API を使用して設計ツールと製造ツールを接続し、工場のデジタル ツインを構築しています。 さらに、ロボットのシミュレーションとテストには NVIDIA Isaac Sim を、自動光学検査にはビジョン AI フレームワークである NVIDIA Metropolis を使用しています。

最新のコンポーネントである NVIDIA Metropolis for Factories は、カスタムの品質管理システムを作成でき、メーカーに競争上の優位性をもたらします。 同コンポーネントは、企業による最先端の AI アプリケーションの開発を支援しています。

AI による組立ラインの高速化

たとえば、ノートPCやスマートフォンを含む 300 種類の製品を世界中で製造している Pegatron は、Omniverse、Isaac Sim、Metropolis と仮想工場を構築しています。 これにより、シミュレーションされた環境で各工程を試すことができ、時間とコストを節約できます。

Pegatronはまた、NVIDIA DeepStreamソフトウェア開発キットを使用してインテリジェントなビデオ アプリケーションを開発し、これによりスループットが 10 倍向上しました。

世界最大のテクノロジ メーカーのサービス部門である Foxconn Industrial Internet は、NVIDIA Metropolis パートナーと協力して、回路基板の品質保証検査ポイントの重要な部分を自動化しています。


基調講演には開場の数時間前から群衆が列をなしていました。

フアンは、台湾に本拠を置く大手企業、Quanta の子会社である Techman Robot が NVIDIA Isaac Sim を活用して、Quantaの製造ラインの検査を最適化した様子をビデオで紹介しました。 これは基本的に、シミュレートされたロボットを使用して、より良いロボットを作る方法をロボットにトレーニングさせるものです。

さらに、フアンは次世代の自律移動ロボット (AMR) フリートを可能にする新しいプラットフォームを発表しました。 Isaac AMR は、自律移動ロボットのフリートのシミュレーション、展開、管理をサポートします。

ADLINK、Aetina、Deloitte、Quantiphi、Siemens を含む大規模なパートナー エコシステムが、これらすべての製造ソリューションを市場に投入するのを支えているとフアンはいいます。

これは、NVIDIA がアクセラレーション コンピューティングによって生成 AI のメリットを企業が実感できるよう支援していることを示すもう 1 つの例です。

「久しぶりにお会いしたので、伝えたいことがたくさんありました」と2時間の講演を終えると、熱烈な拍手がフアンに送られました。

詳細については、基調講演をご視聴ください。