Amazon が汎用性の高い NVIDIA T4 GPU を導入

投稿者: Ian Buck

Amazon は NVIDIA T4 GPU により最高の AI パフォーマンスをクラウドで提供
AWS EC2 G4 インスタンスは高効率な Turing アーキテクチャープロセッサを搭載し、高速化された大規模なAI 推論、クラウド ゲーミング、最新の RTX グラフィックスを高速化

自動化されていながらも、まるで人間のようなカスタマー サービス。あらゆるコネクテッド デバイスでのプロフェッショナル ワークステーション並みの性能。映画品質の PC ゲーミング。これらは北米、ヨーロッパ、およびアジアの AWS で一般向けに提供開始された NVIDIA T4 Tensor コア GPU がクラウド ユーザーにもたらす多様な事例の一部です。

NVIDIA の T4 GPU と広範なソフトウェア プラットフォームを搭載した新しい Amazon EC2 G4 インスタンスは、機械学習やプロフェッショナル デザインからクラウド ゲーミングまで幅広いアプリケーションのコンピューティングの汎用性と効率性をもたらします。ユーザーは、1 つのインスタンスを利用してさまざまなタイプのワークロードをシームレスかつコストパフォーマンスに優れた方法で高速化できます。

NVIDIA の最適化されたソフトウェア スタックには、広範な API 群や CUDA のほか、cuDNNTensorRTNCCLOptiXVideo Codec SDK などの領域特化型 CUDA-X ライブラリが含まれています。

AWS のコンピュート サービス担当バイス プレジデントであるマット ガーマン (Matt Garman) 氏は次のように述べています。「わたしたちは、お客様が計算主体のアプリケーションの利用に二の足を踏む原因となっている最も困難な課題の解決に注力しています。AWS は、機械学習モデルの構築、トレーニング、デプロイに向けた極めて広範なポートフォリオを提供していますが、その基盤となっているのが機械学習のさまざまなユース ケースに最適化された Amazon EC2 の幅広いインスタンス タイプです。T4 GPU を搭載した新しい G4 インスタンスにより、機械学習はすべての開発者の手に届きやすいものとなるでしょう」

少ないコストでより多くの AI を実行

NVIDIA T4 は、第 2 世代の Tensor コア GPUです。このタイプの GPU は、言わば GPU の再発明であり、CUDA のプログラマビリティを維持しながら AI アプリケーションにおける最高のパフォーマンスを実現しています。

最大 130 TOPS の整数演算 (INT8) 性能を備えた NVIDIA T4 は、混合精度のテンソル処理を特徴としています。この処理は画像分類、物体検出自然言語理解、自動音声認識、レコメンダ システムのような AI ベースのアプリケーションの絶えず進化するイノベーション、多様性、および複雑性を加速するために必要とされます。

Amazon は、トレーニングや推論にすぐに使える NVIDIA NGC コンテナをサポートし、NVIDIA GPU に業界で最も早く対応したハイパースケーラーの 1 つです。EC2 P3 インスタンスは NVIDIA V100 Tensor コア GPU を搭載しており、自動混合精度機能によって機械学習トレーニングを数日から数時間に短縮できます。EC2 G4 は、運用コストを大幅に抑えながら AI サービスの大規模デプロイが可能です。

さらに、VMware との最近発表されたパートナーシップにより、VMware Cloud on AWS のお客様は、NVIDIA T4 GPU と新しい NVIDIA Virtual Compute Server (vComputeServer) ソフトウェアによって高速化される Amazon EC2 ベア メタル インスタンスで構成される、非常にスケーラブルでセキュアな新しいクラウド サービスをまもなくご利用いただける予定です。

企業は、このエンタープライズ グレードのハイブリッド クラウド プラットフォームを使用して、アプリケーションのモダナイゼーションを加速させることができます。また、一貫した VMware インフラストラクチャ全体のデプロイメント、マイグレーション、運用をデータ センターから AWS クラウドにかけて統合しながら、AI、機械学習、データ アナリティクスをはじめとする極めて計算集約的なワークロードをサポートすることが可能です。

リアルタイム レイ トレーシングと AI 強化グラフィックスがいつでも、どこでも可能に

コンピューター グラフィックスの究極の理想として長年待ち望まれてきたリアルタイム レイトレーシングは、実物そっくりなシーン描写を実現します。デザイナーやアーティストは、リアルタイムのフォトリアリスティック レンダリング、AI 強化グラフィックス、ビデオ/画像処理により、新たな方法でのコンテンツ制作が可能になります。

NVIDIA T4 は、クラウド初の NVIDIA RTX レイトレーシング GPU です。T4 GPU は、レイトレーシング処理を驚異的な効率で実行することに特化した計算リソースである RT コアを搭載しており、従来の高コストなレイトレーシング手法を不要にします。

新しい G4 インスタンスは、NVIDIA Quadro Virtual Workstation (Quadro vWS) Amazon マシンイメージと組み合わせて、Microsoft DXR、NVIDIA OptiX および Vulkan などの最新のレイトレーシング API をサポートします。メディア & エンターテインメント、建築、製造、石油 ガスなどの業界の技術スタッフや制作スタッフは、最新のグラフィックス ソフトウェア アプリケーションを AWS クラウドから実行することができます。

AWS による仮想ワークステーションの展開は、5 分足らずで素早く簡単に行えます。AWS Marketplace にアクセスし、NVIDIA Quadro vWS マシンイメージと G4 インスタンスを選択するだけです (Windows Server 2016 および Windows Server 2019 に対応)。

GPU によるクラウド ゲーミング

また T4 を支える Turing アーキテクチャは、NVIDIA がゲーミング分野で誇る優れた能力を AWS にもたらします。これによって、動作要件が極めて厳しいゲームのレンダリングや、GPU のハードウェア エンコーダー エンジンを利用したストリーミングを実現できるようになります。このエンコーダー エンジンは、Video Codec SDK によるプログラミングが可能です。

ゲームソフト メーカーは、NVIDIA の最新テクノロジをベースにして独自のクラウド ゲーミング インスタンスを構築すれば、自社の PC タイトルのラインナップ全体をほぼすべてのデバイスに対応させることができます。

ゲーマーは、ハードウェアのアップグレードまたはドライバやゲーム パッチのアップデートをまったく心配する必要なく、すべての最新タイトルを高いフレームレートかつ高解像度の滑らかな動きで楽しむことができます。

この機能を提供する NVIDIA ドライバは AWS Marketplace で入手でき、Windows Server 2016Windows Server 2019、および Linux OS を実行している AWS G4 インスタンスで動作します。

AWS EC2 G4 インスタンスを使ってみよう

Clarifai、Electronic Arts、GumGum、PurWeb のような Amazon EC2 G4 インスタンスの初期顧客は、NVIDIA T4 の計算汎用性とパフォーマンスを多種多様な計算主体のワークロードの大規模実行に利用しています。その結果、強力なサービスを提供すると同時に、それらのサービスの構築および自社顧客に向けたデプロイにかかるコストを削減しています。

G4 インスタンスは、今後数週間のうちに Amazon Elastic Inference もサポートする予定です。このサービスは、Amazon EC2 や Amazon SageMaker のインスタンスに GPU アクセラレーションを追加し、最大 75% カットされた低コストで推論の高速化を実現するものです。

詳細および NVIDIA T4 の試用については、AWS G4 インスタンスのページをご覧ください。