NVIDIA Eos を公開、スーパーコンピューター TOP 10 の運用を覗く

投稿者: Charlie Boyle

世界中の企業のための青写真である NVIDIA の画期的な DGX AI スーパーコンピューターは、AI イノベーションの次のフロンティアを促進するように設計されています

NVIDIA は先週、高度な AI ファクトリーを支えるアーキテクチャを垣間見ることができるデータセンター規模の最新スーパーコンピューター「Eos」を初披露したビデオが公開しました。

極めて大規模な NVIDIA DGX SuperPOD である Eos は、NVIDIA の開発者が、アクセラレーテッド コンピューティング インフラストラクチャと完全に最適化されたソフトウェアを使用して、AI のブレイクスルーを生み出す場所です。

Eos は、NVIDIA DGX H100 システム 576 台、NVIDIA Quantum-2 InfiniBand ネットワーキングおよびソフトウェアで構築され、合計 18.4 エクサフロップスの FP8 AI 性能を提供します。

11 月に開催された Supercomputing 2023 で発表された Eos は、暁の門を毎日開いているされるギリシャ神話の女神にちなんで名付けられたもので、AI 技術の進歩に対する NVIDIA のコミットメントを反映しています。

イノベーションを促進する Eos スーパーコンピューター

各 DGX H100 システムには、8 基の NVIDIA H100 Tensor コア GPU が搭載されています。Eos は合計 4,608 基の H100 GPU を搭載しています。

その結果、Eos は大規模言語モデル、レコメンダー システム、量子シミュレーション、その他をトレーニングするための最大規模の AI ワークロードの処理が可能です。

これは、NVIDIA のテクノロジが、大規模に動作することで何ができるかを示すショーケースです。

Eos は完璧なタイミングで登場します。創薬からチャットボット、自律型マシン、そしてその先に至るまで、人々は生成 AI で世界を変えようとしています。

こうしたブレイスルーを達成するためには、AI の専門知識や開発スキル以上のものが必要です。必要なのは AI ファクトリーであり、いつでも利用可能で、AI モデルを大規模に構築する能力を高めることができる専用 AI エンジンです。

Eos がそれを実現します。世界最速のスーパーコンピューターの TOP500 リストの 9 位にランクインした Eos は、AI 技術とインフラの限界を押し広げます。

これには、NVIDIA Base CommandNVIDIA AI Enterprise などの洗練されたソフトウェア製品とともに、NVIDIA の高度なアクセラーテッド コンピューティングとネットワーキングが含まれています。

Eos のアーキテクチャは、アクセラレーテッド コンピューティング ノードの大規模クラスタ間で超低レイテンシかつ高スループットの相互接続を必要とする AI ワークロード向けに最適化されており、AI 能力の拡張を目指す企業にとって理想的なソリューションとなっています。

インネットワーク コンピューティング テクノロジを搭載した NVIDIA Quantum-2 InfiniBand に基づくそのネットワーク アーキテクチャは、毎秒最大 400Gb のデータ転送速度をサポートし、複雑な AI モデルのトレーニングに不可欠な大規模データセットの迅速な移動を容易にします。

Eos の心臓部には、NVIDIAのDGX H100 システムを搭載した画期的な DGX SuperPOD アーキテクチャがあります。

このアーキテクチャは、AI とコンピューティングの分野に、巨大なスケールでコンピューティングできる緊密に統合されたフルスタック システムを提供するために構築されています。

世界中の企業や開発者が AI のパワーを活用しようとしている中、Eos は極めて重要なリソースとして、あらゆる組織に活力を与える AI を取り入れたアプリケーションへの道を加速させることを約束します。