本日、NVIDIA は、TAO Toolkitの最新バージョンの一般提供を開始したことを発表しました。NVIDIA TAO (Train、Adapt、Optimize) フレームワークのローコード バージョンとなるこのツールキットは、音声およびビジョン認識のための AI モデルの作成を簡略化および加速します。
TAOにより、開発者は転移学習を利用し、欠陥検出や言語翻訳、交通管理など、産業界での多様なユースケースに最適化され、カスタマイズと即時実稼働が可能なモデルを作成できるようになります。これには、膨大な量のデータも必要ありません。
TAO Toolkit の最新リリースには、事前にトレーニングされたビジョンおよび音声認識用モデルが含まれており、開発者の生産性を向上させます。また、ONNX モデルのウェイトのインポート、REST API、および TensorBoard の統合といった新しい機能を実装しています。
TAO Toolkit 3.22.05 をダウンロードする >>
最新リリースの特徴
REST API で TAO Toolkit を as-a-Service として展開: REST API を使用して、新しい AI サービスを構築したり、既存のサービスに統合したりすることが可能になります。Kubernetes 上で TAO Toolkit サービスを管理およびオーケストレーションすることができます。TAO Toolkit as-a-service により、IT 管理者は業界標準の API を使用してスケーラブルなサービスを提供することができます。
独自のモデルの重みを活用: TAO 以外のモデルを TAO で微調整、最適化することができます。ONNX から事前学習された重みをインポートし、独自のモデルにプルーニングや量子化といった TAO の機能を活用することができます。これは、画像の分類やセグメンテーションのタスクでサポートされています。
TensorBoard による可視化: TensorBoard でのトレーニングと検証のロス、モデルウェイトおよび予想される画像といったスカラー値を可視化することで、モデル トレーニングのパフォーマンスを把握できるようになります。実験の際にハイパーパラメータを変更しながら結果を比較すれば、ニーズに最も合ったものを選ぶことができます。
事前トレーニング済みのモデル: モデルが事前にトレーニングされているため、少ないデータでも転移学習によって微調整が可能で、カスタマイズのプロセスをスピードアップできるようになります。
この最新バージョンに実装される事前トレーニング済みの新モデルのいくつかを使うと、以下が可能になります。
- ロボティクスおよび自動車用 LiDAR センサーから集めたデータの適用
- 公共安全、小売、および労働者の安全を守るためのユースケースで使用可能な、人間の姿勢に基づいた行動の分類
- 人間、動物および物体のキーポイントを推測し、動作の描写や物体の形状を明確化
- わずか 30 分の録音データから、スマート デバイス、ゲーム キャラクター、クイックサービスレストラン (QSR) などに活用可能な、カスタマイズされた音声を作成
TAO Toolkit の企業向けのサポートは、AI の開発および展開のためのエンドツーエンドのソフトウェア スイートである NVIDIA AI Enterprise で利用できます。TAO Toolkit の新しいリリースは、NVIDIA AI Enterprise の次の四半期でのアップデートに含まれる予定です。
始めるには
- TAO Toolkit Getting Started ページにアクセスし、教材用ビデオとクイック スタート ガイドをご覧ください。
- NGC から コンピューター ビジョン、または 対話型 AI のモデルをダウンロードしてください。
- Rest API、TensorBoard および事前トレーニング済みモデルといった新機能のデモ ビデオをご視聴ください。
TAO Toolkit を活用したソリューション
- NVIDIA Isaac Sim および NVIDIA TAO を活用した AI ロボットの開発と展開
- パートナー企業であるLexSetのプラットフォームを使用して合成データを生成し、TAO Toolkitを使用してオブジェクト検出とセグメンテーションモデルを微調整する方法について説明したブログ
- TAO Toolkit による、動物の健康と表現型の検知。ウェビナーへのお申込みでさらなる詳細を知る
- RocketBoots が、自動化された従業員管理における推論性能を向上
- 小売りの行動認識ユースケースにおける開発を変革