AI エージェントは、多様なタスクを実行できる「ナレッジ ロボット」によって、世界中の 10 億人のナレッジ ワーカーの生産性に変革をもたらそうとしています。AI エージェントを開発するにあたり、企業は信頼性、安全性、セキュリティ、コンプライアンスなどの重要な懸念事項に対処する必要があります。
AI ガードレール向けの新しい NVIDIA NIM マイクロサービス (NVIDIA NeMo Guardrails のソフトウェア ツール コレクションの一部) は、移植性が高く最適化された推論マイクロサービスであり、企業が生成 AI アプリケーションの安全性、精度、スケーラビリティを向上させるのに役立ちます。
マイクロサービスのオーケストレーションの中心となるのが NeMo Guardrails です。NVIDIA NeMo プラットフォームの一部である NeMo Guardrails は、AI のキュレーション、カスタマイズ、ガードレールの設置を行い、開発者が AI ガードレールを大規模言語モデル (LLM) アプリケーションに統合して管理するのに役立ちます。業界を牽引する Amdocs、Cerence AI、Lowe’s といった企業が、NeMo Guardrails を使用して AI アプリケーションを保護しています。
開発者は NIM マイクロサービスを使用して、コンテキスト固有のガイドラインに従って安全かつ適切な応答を提供し、ジェイルブレイク試行への耐性が強化された、より安全で信頼性の高い AI エージェントを構築できます。こうしたエージェントが自動車、金融、ヘルスケア、製造、小売などの業界のカスタマー サービスに展開されることで、顧客満足度と信頼性がさらに高まります。
コンテンツの安全性をモデレートするために構築された新しいマイクロサービスの 1 つは、人間によってアノテーションされたこのカテゴリで最高クラスのデータ ソースである Aegis Content Safety Dataset を使用してトレーニングされました。NVIDIA がキュレーションして所有するこのデータセットは Hugging Face で一般公開されています。人間によってアノテーションされた 35,000 を超えるデータ サンプルが含まれており、AI の安全性と、システム制限を回避するジェイルブレイクの試みについてフラグが付けられています。
NVIDIA NeMo Guardrails が AI エージェントを軌道に乗せる
AI は、さまざまなビジネス プロセスの生産性を急速に向上させています。カスタマー サービスでは、AI によって顧客の問題解決までの時間が最大 40% 速くなっています。しかし、カスタマー サービスなどの AI エージェント向けに AI を拡張するには、有害または不適切な出力を防ぎ、AI アプリケーションが定義されたパラメーター内で動作することを可能にする安全なモデルが必要です。
NVIDIA は NeMo Guardrails 向けに、動作の制御を維持しながら AI エージェントが大規模に動作できるようにする以下の 3 つの新しい NIM マイクロサービスを発表しました。
- コンテンツ セーフティ NIM マイクロサービスは、偏見のある出力や有害な出力を生成しないように AI を保護します。このマイクロサービスにより、倫理基準に準拠した応答が得られます。
- トピック コントロール NIM マイクロサービスは、承認されたトピックに会話を集中させるようにして、話の脱線や不適切なコンテンツを回避します。
- ジェイルブレイク検出 NIM マイクロサービスは、ジェイルブレイクの試みに対する保護を追加し、敵対的なシナリオで AI の整合性を維持するのに役立ちます。
軽量で専門的な複数のモデルをガードレールとして適用することで、開発者は一般的なグローバル ポリシーと保護だけでは対処できない可能性のあるギャップを補うことができます。これは、一律適用なアプローチでは、エージェント型 AI の複雑なワークフローを適切に保護および制御できないためです。
NeMo Guardrails コレクションに含まれるような小規模言語モデルは、低レイテンシで、リソースが制限された環境や分散環境でも効率的に動作するように設計されています。そのため、ヘルスケア、自動車、製造などの業界において、病院や倉庫などでの AI アプリケーションをスケーリングするのに最適です。
業界のリーダー企業やパートナー企業が NeMo Guardrails で AI を保護
オープンソース コミュニティに提供されている NeMo Guardrails により、開発者は、レールと呼ばれる複数の AI ソフトウェア ポリシーを編成して、LLM アプリケーションのセキュリティと制御を強化することができます。NVIDIA NIM マイクロサービスと連携することで、安全性やパフォーマンスを犠牲にすることなく大規模に展開できる AI システムを構築するための堅牢なフレームワークが提供されます。
通信およびメディア企業向けにソフトウェアとサービスを提供する大手グローバル プロバイダー、Amdocs は、NeMo Guardrails を活用し、より安全で正確かつ状況に適した応答を提供することで、AI 駆動の顧客インタラクションを強化しています。
Amdocs のテクノロジ グループ プレジデント兼戦略責任者である Anthony Goonetilleke 氏は次のように述べています。「NeMo Guardrails のようなテクノロジは、生成 AI アプリケーションを保護するために不可欠であり、こうしたテクノロジにより生成 AI アプリケーションは安全かつ倫理的に動作することができます。NVIDIA NeMo Guardrails を Amdocs の amAIz プラットフォームに統合することで、プラットフォームの『Trusted AI』機能が強化され、安全で信頼性が高くスケーラブルなエージェント体験がもたらされます。これにより、サービス プロバイダーは AI ソリューションを安全かつ自信を持って展開できるようになり、AI のイノベーションと運用の卓越性に関する新しい基準が確立されます」
自動車業界向け AI ソリューションを専門とする Cerence AI は、NVIDIA NeMo Guardrails を使用して、車載アシスタントが、CaLLM ファミリーの大規模および小規模言語モデルを活用した、コンテキストに適切で安全なインタラクションを提供することを可能にしています。
Cerence AI の製品およびテクノロジ担当エグゼクティブ バイス プレジデントである Nils Schanz 氏は次のように述べています。「Cerence AI は、NVIDIA の高性能で安全なソリューションを利用して車載アシスタント テクノロジを強化しています。NeMo Guardrails を使用することで、自動車メーカーの顧客に信頼できるコンテキスト認識ソリューションを提供し、分別と気配りのある、ハルシネーションが起きない応答を提供できます。さらに、NeMo Guardrails は自動車メーカーの顧客向けにカスタマイズができるため、有害または不快なリクエストをフィルタリングして、CaLLM ファミリーの言語モデルがエンド ユーザーに意図しないまたは不適切なコンテンツを提供しないように保護することができます」
ホームセンター大手の Lowe’s は、生成 AI によって店舗スタッフの深い専門知識を活用しています。製品の包括的な知識へのアクセス性が高まるこれらのツールにより、スタッフは顧客の質問に答えることができ、プロジェクトを完了するための適切な製品を見つける一助となり、小売業のイノベーションと顧客満足度の新しい基準を確立します。
Lowe’s のデータ、AI、イノベーション担当シニア バイス プレジデントである Chandhu Nair 氏は次のように述べています。「私たちは、スタッフが顧客のために極上のサービスを提供するための方法を常に模索しています。直近の NVIDIA NeMo Guardrails の導入によって、安全性、セキュリティ、信頼性が確保された AI 生成の応答を活用できるようになり、会話の境界を守ることで関連性のある適切なコンテンツのみが提供されるようになりました」
小売業界での AI アプリケーションの開発と展開への AI セーフガードの採用をさらに加速するため、NVIDIA は最近開催された NRF のトレードショーで、小売りショッピング アシスタント向けの NVIDIA AI Blueprint に NeMo Guardrails マイクロサービスを組み込むことで、デジタル ショッピング体験中の顧客とのやり取りがさらに信頼性が高く、制御されたものになることを発表しました。
コンサルティング業界の大手企業である Taskus、Tech Mahindra、Wipro も、NeMo Guardrails を自社のソリューションに統合しており、エンタープライズのクライアントに、より安全で信頼性が高く、制御された生成 AI アプリケーションを提供しています。
NeMo Guardrails はオープンで拡張可能であり、主要な AI 安全モデルやガードレール プロバイダー、AI の可観測性 (オブザーバビリティ) および開発ツールの堅牢なエコシステムと統合されています。NeMo Guardrails は、ActiveFence の ActiveScore との統合がサポートされており、ActiveScore は対話型 AI アプリケーションで有害または不適切なコンテンツをフィルタリングし、可視性、分析、監視機能を提供します。
画像、動画、音声コンテンツ用の AI 生成コンテンツ検出モデルを NIM マイクロサービスとして提供している Hive は、NeMo Guardrails を使用して AI アプリケーションに簡単に統合およびオーケストレーションできます。
Fiddler AI の Observability プラットフォームは、NeMo Guardrails との統合が簡単にでき、AI ガードレール監視機能を強化します。また、エンドツーエンドの AI 開発者プラットフォームである Weights & Biases は、NeMo Guardrails マイクロサービスとの統合を追加することで、W&B Weave の機能を拡張しています。この機能強化は、本番環境で AI 推論を最適化するために、Weights & Biases の既存の NIM 統合ポートフォリオに基づいています。
NeMo Guardrails が AI 安全性テスト用のオープンソース ツールを提供
セーフガード モデルやその他のレールの適用の有効性をテストする準備ができている開発者は、NVIDIA Research チームが開発した LLM およびアプリケーションの脆弱性スキャンができるオープンソース ツールキットである NVIDIA Garak を使用できます。
開発者は Garak を使用して、データ漏洩、プロンプト インジェクション、コードのハルシネーション、ジェイルブレイクといった各シナリオの問題を評価でき、LLM を使用するシステムの脆弱性を特定できます。Garak が不適切または不正確な出力を含むテスト ケースを生成することで、開発者は AI モデルの潜在的な弱点を検出して対処し、堅牢性と安全性を高めることができます。
提供予定
NVIDIA NeMo Guardrails マイクロサービス、レール オーケストレーション用 NeMo Guardrails、および NVIDIA Garak ツールキットは、開発者およびエンタープライズ向けに提供されています。開発者は NeMo Guardrails を使用した顧客サービス用の AI エージェントに AI セーフガードを構築することができます。こちらのチュートリアルを参照してください。
ソフトウェア製品情報についてはこちらの通知をご覧ください。