Oracle Cloud Infrastructure が NVIDIA AI ソフトウェア上での実行に最適化された NVIDIA A100 GPU インスタンスの提供を開始
AI が市場に驚異的な変革をもたらしています。すべての企業が AI の取り巻く環境に身を置く日もそう遠くはないでしょう。そして、ますます複雑化する機械学習モデルに企業が対応するには、スピードとスケールを兼ね備える必要があります。
世界中の企業のイノベーションを加速するために、Oracle は本日、NVIDIA A100 Tensor コア GPU を搭載した Oracle Cloud Infrastructure のベアメタル インスタンスの一般提供の開始を発表しました。
NVIDIA の創業者/CEO であるジェンスン フアン (Jensen Huang) は、新しいインスタンスに関する Oracle Live のデジタル発表に登場し、次のように述べました。「Oracle は企業が社内データを保存する場所です。私たちは一切摩擦を生じさせずにそのデータを取得し、Oracle Cloud Infrastructure 上で実行し、データ分析を行い、データ フレームを作成できるようになります。そのデータ フレームを使用することで、機械学習は予測モデルを作成する方法を学習します。予測モデルによって推奨されるアクションは、企業が比類ないスケールでより速く対応し、よりスマートな意思決定を行うのに役立ちます。」
ジェンスン フアンと Oracle Cloud Infrastructure 担当エグゼクティブ バイス プレジデントのクレイ マゴウイーク (Clay Magouyrk) 氏が、Oracle Live で企業における AI について語っていますのでご覧ください。
さまざまな業界の何十万もの企業が、自社のデータを Oracle のデータベースに格納しています。その生データはすべて、Oracle Cloud Infrastructure 上で実行される A100 インスタンスを使った Al 分析にかける準備が整っています。この分析結果から、企業は新しいビジネス機会を見出し、顧客センチメントを理解して、製品を生み出すことができます。
新しい Oracle Cloud Infrastructure ベアメタル BM.GPU4.8 インスタンスは、高速な NVIDIA NVLink でGPU間を直接相互接続する、40GB の NVIDIA A100 GPU を 8 基提供します。世界でもっともパワフルな GPU である A100 を採用することで、Oracle Cloud Infrastructure インスタンスは、トレーニング、推論、データ サイエンスにおいてさまざまな AI ワークロードを実行されているお客さまに最大 6 倍のパフォーマンス向上をもたらします。きわめて要求の厳しいアプリケーションの原動力となるこの新しいインスタンスは、NVIDIA Mellanox ネットワーキングを使用してスケールアップし、1 つのインスタンスで 500 基以上の A100 GPU を提供することもできます。
NVIDIA のソフトウェアが Oracle のエンタープライズ向けAI と HPC を加速
アクセラレーテッド コンピューティングは強力なプロセッサから始まりますが、ソフトウェア、ライブラリ、アルゴリズムはどれも AI エコシステムには不可欠なものです。それがコンピューター グラフィックスか、流体力学のようなシミュレーションか、ゲノミクス処理か、ディープラーニングとデータ分析かに関係なく、どの分野も独自の領域に特化したソフトウェア スタックを必要としています。Oracle は、クラウドネイティブの GPU に最適化されたコンテナーやモデル、業界に特化したソフトウェア開発キットから成る NVIDIA NGC ハブを通じて、NVIDIA の広範なドメイン固有のソフトウェアを提供します。
「機械学習のコストはハードウェア面だけではありません」と、Oracle Cloud Infrastructure 担当エグゼクティブ バイス プレジデントのクレイ マゴウイーク氏は指摘します。「誰かが適切なツールを使っていかに素早く行動に移せるか、そして、適切なソフトウェアにいかに素早くアクセスできるかも重要です。これらのインスタンスではすべてが事前にチューニングされているため、人を選ばず誰でも利用でき、これらの GPU を時間単位で借りて、Oracle Cloud 上で機械学習の実行を即座に開始できます。」
また Oracle は、Oracle Cloud Infrastructure Data Science プラットフォームにも A100 を取り入れ、NVIDIA ディープ ニューラルネットワーク ライブラリを Oracle Cloud Marketplace から提供する予定です。これによりデータ サイエンティストは、一般的な機械学習とディープラーニング フレームワークや、Jupyter Notebook、Python/R 統合開発環境を数分で実行できるようになります。
世界をリードする AI パフォーマンスをオンデマンドで利用
この新しい Oracle のインスタンスにより、あらゆる企業がクラウドでもっともパワフルなコンピューティングを利用できるようになります。A100 は、第 3 世代の Tensor コア上で実行される TF32 の演算とスパース技術を用いることで、前世代よりも最大 20 倍のピーク AI パフォーマンスを実現します。世界最大の 7 nm プロセッサである A100 は、信じられないほどの柔軟性とコスト効率を実現しています。
A100と Mellanox RDMA over Converged Ethernet ネットワーキングによる柔軟なパフォーマンスを備えた新しい Oracle Cloud Infrastructure インスタンスの活用例には、重要な創薬研究に最適であることや、対話型 AI によってカスタマー サービスを向上させることが可能なこと、設計者がより安全な製品をモデル化して構築できることなどが挙げられます。
企業のあらゆるステージでの、あらゆる規模のワークロードに対応する AI アクセラレーション
新興企業は、NVIDIA Inception および Oracle for Startups アクセラレーター プログラムを通じて、A100 のパフォーマンスを活用いただけます。これらのプログラムでは、NVIDIA A100 および V100 GPU インスタンスに対する無料のOracle Cloud クレジットや、特別価格、非常に有益なネットワーキングと専門知識、マーケティングの機会などを提供しています。
Oracle はまもなく、VM あたり 1 基、2 基、または 4 基の A100 GPU を提供する仮想マシン インスタンスを導入し、ベアメタルの A100 GPU インスタンスと Intel CPU から成る最大 512 基の A100 GPU を搭載したヘトロジニアスなクラスター ネットワークを提供する予定です。Oracle の新しいA100 インスタンスによってワークロードを加速することに関心をお持ちの方は、9 月 30 日に Oracle Cloud Infrastructure の利用を開始できます。
Oracle Cloud Infrastructure 上で AI を加速する方法の詳細については、10 月 5 ~ 9 日に開催される GTC での Oracle の発表にご参加ください。