スーパーコンピューティングのスーパーパワー: NVIDIA がデジタル ツイン シミュレーションを HPC データセンター 事業者に提供

投稿者: Mark Hamilton

NVIDIA Omniverse は、科学や産業のワークフローを超え、世界で最も複雑な施設の設計者、建設者、運用者が仮想世界の力を活用することを可能にします

世界の 700 万のデータセンターを支えるテクノロジは急速に変化しています。最新のテクノロジにより、IT 組織は指数関数的なデータの増加に対処しながらもコストを削減することが可能になりました。

シミュレーションとデジタル ツインは、データセンターの設計者、建設者、運用者が非常に効率的で高性能な施設を作る上で役立ちます。しかし、AI スーパーコンピューティング施設のすべてのコンポーネントを正確に表現できるデジタル ツインを構築することは、大規模で複雑な作業です。

NVIDIA Omniverse シミュレーション プラットフォームは、共同仮想設計のプロセスを合理化することで、この課題に対処するのに役立ちます。Supercomputing 2022 カンファレンスでの Omniverse デモでは、データセンターを支える人々がこのオープンな開発プラットフォームを使用して、複雑なスーパーコンピューティング設備の設計と開発を強化する方法を紹介しました。

Omniverse では初めて、データセンターの事業者がコアのサードパーティ製のコンピューター支援設計、シミュレーション、および監視アプリケーションからリアルタイムのデータ入力を集約し、リアルタイムに完全なデータセットを表示して操作できるようになります。

このデモでは、Omniverse を使用して、ユーザーがアクセラレーテッド コンピューティング、シミュレーション、およびリアルタイム監視と AI に接続された運用デジタル ツインの力を活用できることを示しています。これにより、チームは施設の設計を合理化し、建設と展開を加速し、進行中の運用を最適化できます。

このデモでは、Omniverse と連携してネットワーク (データ センターの中枢神経系) をシミュレーションするように設計されたデータセンター シミュレーション プラットフォームである NVIDIA Air も紹介されました。NVIDIA Air を使用すると、チームはネットワーク スタック全体をモデル化できるため、ネットワーク ハードウェアとソフトウェアを立ち上げる前に自動化および検証できます。

設計とシミュレーションを向上させるデジタル ツインの作成

NVIDIA の最新の AI スーパーコンピューターの 1 つを計画および構築する際に、Autodesk RevitPTC Creo、Trimble SketchUp などのサードパーティの業界ツールから複数のエンジニアリング CAD データセットが収集されました。これにより、デザイナーとエンジニアは Universal Scene Description ベースのモデルを完全な忠実度で表示し、リアルタイムに共同で設計の反復作業を行うことができました。

PATCH MANAGER は、ネットワーク ドメイン内の配線、資産、および物理層のポイント ツー ポイント接続を計画するためのエンタープライズ ソフトウェア アプリケーションです。PATCH MANAGER を Omniverse に接続すると、ポート間接続、ラックとノードのレイアウト、ケーブル配線の複雑なトポロジをライブ モデルに直接統合できます。これにより、データセンターのエンジニアは、モデルとその依存関係の全体像を確認できます。

気流と熱伝達を予測するために、エンジニアは数値流体力学用のソフトウェアである Cadence 6SigmaDCX を使用しました。エンジニアはまた、NVIDIA Modulus でトレーニングされた AI サロゲートを使用して、ほぼリアルタイムで「what-if」分析を行うこともできます。これにより、チームは複雑な熱と冷却の変化をシミュレーションでき、その結果を即座に確認することができます。

また、NVIDIA Air を使用すると、プロトコル、監視、自動化を含む正確なネットワーク トポロジをシミュレーションし、事前に検証することができます。

データセンターの構築が完了すると、そのセンサー、制御システム、およびテレメトリを Omniverse 内のデジタル ツインに接続して、運用をリアルタイムで監視できます。

完全に同期されたデジタル ツインにより、エンジニアは電力のピークや冷却システムの障害などの一般的な危険をシミュレーションできます。オペレーターは、エネルギー効率の向上や二酸化炭素排出量の削減などの重要な優先事項に対して最適化されたAI が推奨する変更を利用することができます。また、デジタル ツインにより、物理データセンターに展開する前に、ソフトウェアとコンポーネントのアップグレードをテストおよび検証することもできます。

Supercomputing 2022 において、NVIDIA 特別講演の最新発表をご覧ください。また、NVIDIA Omniverse の詳細についてはこちらをご確認してください。