主要 OEMが、AI ワークロードへの対応を目的とした、世界初の NVIDIA 認証システムを投入

投稿者: Adel El Hallak

独自プログラムで機械学習および分析のテストを経た、唯一のアクセラレーテッド サーバーが登場

AI は今の時代の最も強力なテクノロジですが、さらなる発展のためには、最適化およびテストされた、新世代のコンピューターが必要となります。

NVIDIA のパートナーが提供する新しいクラスのアクセラレーテッド サーバーによって、本日より、データセンターはAI とデータ分析をさらに加速させることができます。大手システム メーカーが、現代のワークロードに対処できることがテストで初めて認証された NVIDIA認証システムの第 1 弾を提供しようとしています。

これらのシステムは、最新の GPU によって AI を加速し、NVIDIA Mellanox のネットワークを活用しています。機械学習の手法を駆使し、企業データの山から洞察を掘り起こし、従来のシステムでは得られなかった原石を探り当てられるようになります。

本日、Dell Technologies、GIGABYTE、Hewlett Packard Enterprise、Inspur および Supermicro の各社が揃って、認証サーバーの出荷を開始しました。NVIDIA は、世界中の大手 OEMと連携し、あらゆる業界で AI の発展に寄与しています。

NVIDIA A100 Tensor コア GPU を搭載して出荷される、第 1 弾のシステムは、以下の通りとなっています。

  • Dell EMC PowerEdge R7525 および R740 ラック サーバー
  • GIGABYTE R281-G30、R282-Z96、G242-Z11、G482-Z54、G492-Z51 システム
  • HPE Apollo 6500 Gen10 システムおよび HPE ProLiant DL380 Gen10 サーバー
  • Inspur NF5488A5
  • Supermicro A+ サーバーAS -4124GS-TNR および AS -2124GQ-NART

これらのシステムのすべてに、NVIDIA 認証システムのバッジが付けられており、NVIDIA の厳しい設計要件を満たしたシステムであるという安心感をお客様に与えます。このバッジは、これらのシステムが機械学習やデータ分析といった、最も困難な課題に対処できることを示しています。


アクセラレーテッド サーバーの大手メーカーが、NVIDIA 認証システムを本日出荷開始

エンタープライズ AI の転換点

このシステムが誕生したのは、大手企業で AI の導入に弾みがついているからです。

American Express では、最新の AI モデルを使用して、不正検知をリアルタイムで行っています。Ford は、敵対的生成ネットワークを活用して、自動運転車のテストに必要なデータを生成しています。また、Dominos では、AI を利用して、毎年 30 億枚のピザの配達が可能になるように、注文予測を向上させようとしています。

これらの企業は、ウェブで生まれた新しい形態のコンピューティングを導入している多くの企業の一部であり、小売りや物流、銀行、ヘルスケアなどの分野に拡大しています。

Gartner では、すべての組織の 37% が現在、AI を利用しており、2024 年にはその比率が75% に倍増すると予想しています。

増え続けるビッグデータに対処

企業は、積もり続けるデータの山から戦略的な洞察を得る方法を模索しています。たとえば、Walmart では、毎時 2.5 ペタバイトを越えるデータを処理しています。

そのようなデータを選別するための AI モデルは、わずか 5 年で規模がほぼ 30,000 倍に拡大しており、アクセラレーテッド コンピューティングに対する需要が高まっています。AI を使ったモデルやワークロードもどんどん多様化しているため、企業には GPU がもたらす柔軟性が必要となっています。

データの増大とそれを選別する AI モデルの普及により、データセンターおよびネットワークのエッジ側の両方でネットワーク トラフィックが指数関数的に増加しつつあります。それに対処するために、企業は効率的に拡張できる、安全かつ信頼できる、高速のインフラストラクチャを必要としています。

AI テストに合格するために

NVIDIA 認証システムは、エンタープライズ AI に求められるパフォーマンスやプログラマビリティ、および安定したスループットを実現します。これらのシステムでは、NVIDIA Ampere アーキテクチャをベースにした GPU のコンピューティング パワーに、安全で高速な NVIDIA Mellanox ネットワークが組み合わされています。

認証を取得するには、システムは複数の演算ノードを使用するジョブから、1 つの GPU の一部だけを必要とするタスクに至る、多様なワークロードを対象としたテストに合格しなければなりません。

これらシステムは、NVIDIA の GPU 最適化アプリケーションのハブである、NGC カタログにある AI アプリケーションを実行するように最適化されています。

NGC には、AI を垂直市場にもたらすための多様なソフトウェア開発キットが含まれており、そのなかにはヘルスケア向けのもの (Clara) やロボティクス向けのもの (Isaac) などがあります。さらに、企業が新しいユース ケースに着手するためのフレームワークも用意されており、レコメンデーション システム (Merlin) やインテリジェント ビデオ解析 (Metropolis) などへの対応が可能です。

具体的には、NVIDIA 認証システムは、以下についてのテストに合格する必要があります。

  • ディープラーニングの学習と推論
  • 機械学習のアルゴリズム
  • インテリジェント ビデオ解析
  • ネットワークとストレージのオフロード

これらのテストは、現実世界のユースケースに焦点を当てており、 NGC カタログより入手可能な人気のある AI フレームワークとコンテナーが使用されています。

その結果、NVIDIA 認証システムを導入するあらゆる企業が、地球上で最もパワフルな AI コンピューターのいくつかで使用されているものと同じハードウェアとソフトウェアを利用できるようになるのです。

世界最大規模のクラウド サービス プロバイダーと世界の最速スーパーコンピューターの上位 10 のうちの 8 つが、NVIDIA のテクノロジを利用しています。また、NVIDIA のテクノロジをベースにしたシステムは、MLPerf のような AI ベンチマークのフロントランナーとなっています。

傑出した機能を実装

NVIDIA 認証システムには、最大 8 基の A100 GPU と高速の InfiniBand または Ethernet ネットワーク アダプターを搭載した、強力なデータセンター サーバーが含まれています。それ以外にも、企業ネットワークのエッジで AI を実行するために最適化された、主流の AI システムが含まれています。

OEMは、NVIDIA Mellanox ケーブル、スイッチとともに ConnectX-6 InfiniBand またはEthernet アダプターと BlueField-2 DPU のようなネットワーク カードを使用したシステムを認証しています。これらのアダプターは、低いレイテンシかつ高スループットを実現するだけでなく、起動時におけるハードウェアの信頼の基点から、アプリケーションの接続追跡に至る、さまざまなレイヤーのセキュリティに対応しています。

認証されているあらゆるシステムは、NVIDIA Mellanox 8700 HDR 200G InfiniBand スイッチまたは Mellanox SN3700 Ethernet スイッチのいずれかを使用しています。

すべての NVIDIA 認証システムには、オープン ソース コードへのサポートを含んだ完全なソフトウェア スタックを対象とする、エンタープライズ サポートが用意されています。あらゆる垂直市場の企業が、即座に AI の恩恵を受けられるようにしたいと NVIDIA は考えているからです。

最新のシステムが Dell Technologies、GIGABYTE、HPE、Inspur および Supermicro からリリースされ、あらゆる企業がエンタープライズ AI に向けての取り組みを始めることができます。

6 つのシステム メーカーの 14 のサーバーがすでに認証を受けており、アクセラレーテッド コンピューティングを実現する準備が整っています。今後はさらに、このプログラムに参加している、少なくとも 11 のシステム メーカーからおよそ 70 のシステムが登場します。

NVIDIA 認証システムはさらに多くのパートナーからリリースされる予定です。