Edge Computing Infrastructure Program は、単一の重要な機能からスタートしましたが、現在では、NVIDIA EGX ベースのシステム向けに数十もの AI 用途のパイプラインを持ち、Triton Inference Server によって管理されます。
2019 年、米国郵政公社 (USPS) は、1 日に 1 億通を超える郵便物を扱いながら、これらをそれぞれ識別し、追跡する必要がありました。
USPS の AI アーキテクトであるライアン シンプソン (Ryan Simpson) 氏には、あるアイデアがありました。郵便のチームが開発していた画像分析システムを拡張し、今までよりも幅広く、この干し草の山の中から針を見つけるような問題に取り組みたいと考えたのです。
エッジ AI サーバーを処理センターに戦略的に配置すれば、USPS の各センターで生成される何十億枚もの画像を分析することができると同氏は考えました。そしてその結果、いくつかの重要なデータ ポイントで表現された洞察は、ネットワークを介して迅速に共有できます。
このデータ サイエンティストは、NVIDIA の 6 人のアーキテクトを含むスタッフとともに、1 つの長いハッカソンのようにも感じられた 3 週間の集中作業により、必要なディープラーニング モデルを設計しました。この作業から、今日 USPS の NVIDIA EGX プラットフォーム上で稼働している分散エッジ AI システムである Edge Computing Infrastructure Program (ECIP、「イーシップ」と発音) が誕生しました。
エッジにおける AI プラットフォーム
エッジ AI は、多くの素晴らしいパフォーマンスを実現するためのある種の「舞台」であるとも言えます。ECIP では、自動化された目のように機能する 2 つ目のアプリをすでに運用しています。このアプリはさまざまなビジネス ニーズに合わせて郵便物を追跡します。
Hewlett-Packard Enterprise 製の NVIDIA-Certifiedエッジ サーバーを使用する ECIP を含め、USPS のさまざまなシステムを統括するマネージャーのトッド シンメル (Todd Schimmel) 氏は、次のように述べました。「以前は 8 ~ 10 人で数日かけて郵便物を追跡していましたが、今では 1 ~ 2 人が数時間かけるだけで済んでいます。」
さらにもう 1 つ、効果的な分析があります。この分析によると、以前は 800 基の CPU を搭載したサーバーのネットワークで 2 週間かかっていたコンピューター ビジョンのタスクが、1 台の HPE Apollo 6500 サーバーに搭載された 4 基の NVIDIA V100 Tensor コア GPU を使用すれば 20 分で完了したとのことです。
現在、各エッジ サーバーは、毎日、1,000 台以上の郵便物処理機から送られてくる 20 テラバイトもの画像を処理しています。NVIDIA のオープン ソース ソフトウェア Triton Inference Server は、「デジタル郵便担当者」のような役割を果たし、195 台のシステムがそれぞれ必要とする AI モデルを、必要なときに必要な方法で提供します。
エッジ用の次のアプリ
USPS は、ECIP の次に導入するアプリとして、光学式文字認識 (OCR) を使って画像処理のワークフローを効率化するアプリのリクエストをしました。
シンメル氏は次のように述べました。「過去には、OCR のために新しいハードウェアやソフトウェアなどのインフラ全体を購入していました。また、パブリック クラウド サービスを利用する場合は、画像をクラウドに送る必要がありますが、約 10 億枚もの画像を扱うので、大量の帯域幅が必要となり、膨大なコストがかかります。」
今日の新しい OCR の使い方では、ECIP 上のコンテナでディープラーニング モデルを利用し、Kubernetes で管理され、Tritonで提供してます。
コロナ禍の発生当初、ECIP の初期導入は同じシステム ソフトウェアによってスムーズに行われました。オペレーターはコンテナを展開して最初のシステムを稼働させると同時に、他のシステムが納入され、ほぼすべてのノードのネットワークがインストールされるのに合わせて更新しました。
シンメル氏は次のように述べています。「導入はとても効率的に行われました。2019 年 9 月に契約を結び、2020 年 2 月にシステムの導入を開始し、8 月までにはほとんどのハードウェアを完成させました。USPS は非常に満足していました。」
Triton がモデルの提供を迅速化
ECIP が有する「魔法のソフトウェア」の 1 つである Triton は、さまざまなディープラーニングのフレームワークをサポートしているさまざまなバージョンの GPU や CPU を搭載した各種システムへの各種 AI モデルの提供を自動化します。これにより、200 台近くの分散サーバーで構成される ECIP ネットワークのようなエッジ AI システムにかかる時間が大幅に短縮されます。
郵便物をチェックするアプリだけでも、6 つ以上のディープラーニング モデルによる作業を互いに調整しつつ、それぞれの機能をチェックする必要があります。オペレーターは、より多くの機能を実現するモデルを追加することで、アプリをさらに強化していきたいと考えています。
シンメル氏は次のように語ります。「今までに導入したモデルは、郵便物と郵政公社を管理し、私たちの使命を維持するために有用です。」
エッジ AI アプリのパイプライン
これまでのところ、エンタープライズ分析や財務およびマーケティングに至るまでの USPS の各部門から、30 もの ECIP 用アプリケーションのアイデアが生まれています。シンメル氏は、そのうちのいくつかを今年中に稼働させたいと考えています。
そうしたアプリの 1 つは、荷物の大きさ、重さ、および宛先に合った適切な切手が貼られているかどうかを自動的にチェックするものです。また、破損したバーコードを自動的に解読するアプリもあり、これは早ければ今夏にはオンラインになる予定です。
同氏は次のように語ります。「このアプリには、私たちとお客様の双方にとって、特定の小包がどこにあるかを把握できるというメリットがあります。これは万能薬というわけではないものの、一部のギャップを埋めてパフォーマンスを向上させることができます。」
この取り組みは、USPS のデジタル フットプリントを調査するとともに、顧客に利益をもたらす形でデータの価値を引き出すための USPS の幅広い施策の一環として行われています。
シンメル氏は次のように述べています。「私たちはエッジ AI の旅を始めたばかりです。当社のスタッフは毎日、機械学習をロボティクス、データ処理、および画像処理の新たな側面に応用する新たな方法を模索しています。」
エッジ コンピューティングのメリット、NVIDIA EGX プラットフォーム、そして NVIDIA のエッジ AI ソリューションがあらゆる業界をどのように変革しているかについてもお読みいただけます。
※冒頭の写真: 荷物が適切に取り扱われ、仕分けられているかを確認するために抜き取り検査を実施する郵政公社の職員。写真提供: 米国郵政公社