NVIDIA Edify が 3D 生成 AI、ビジュアル コンテンツ プロバイダー向けの新しいイメージ コントロールを利用可能に

投稿者: Gerardo Delgado

Shutterstock 3D 生成は早期アクセスを提供し、 Getty Images は企業向けにカスタム ファインチューニング機能を導入。 Be.Live、Bria、Cuebric は推論のために NVIDIA Picasso AI Foundry を採用

ビジュアル生成 AI のマルチモーダル アーキテクチャである NVIDIA Edify は、新たな次元に入りつつあります。

3D アセット生成は、Edify が開発者やビジュアル コンテンツ プロバイダーに提供する最新機能の 1 つであり、AI 画像生成に対してよりクリエイティブにコントロールできるようになります。

マルチメディア コンテンツおよびデータ プロバイダーである Shutterstock は、クリエイターがテキスト プロンプトや画像を使用して仮想シーン用の 3D オブジェクトを迅速に生成できるようにする Edify アーキテクチャに基づいて構築された API (アプリケーション プログラミング インターフェイス) への早期アクセスを展開しています。

ビジュアル コンテンツ クリエイターおよびマーケットプレイスのGetty Imagesは、商業的に安全な生成 AI サービスにカスタム ファインチューニング機能を追加し、企業顧客がブランド ガイドラインとスタイルに準拠したビジュアルを生成できるように支援します。 このサービスには、顧客が生成した画像をさらに詳細にコントロールできるようにする新機能も組み込まれます。

開発者は、 NVIDIA GTC で発表された推論用のマイクロサービスのコレクションである NVIDIA NIM を通じて、Getty Images と Shutterstock による事前トレーニング済みの Edify モデルを API としてテストドライブできます。 開発者は、NVIDIA DGX Cloud 上に構築された AI ファウンドリである NVIDIA Picasso を通じて、Edify アーキテクチャを使用して独自の生成 AI モデルをトレーニングして展開することもできます。

NVIDIAとAdobeは、Edify上に構築された新しい3D 生成 AIテクノロジを数百万人のFireflyおよびCreative Cloudクリエイターに提供するために協力しています。

ライブ配信プラットフォーム Be.Live は、NVIDIA Picasso ファウンドリ サービスを使用して、ビジュアルの自動作成と視聴者へのインタラクティブな体験を可能にするリアルタイム生成 AI を提供しています。 Bria は、責任あるビジュアル生成 AI を開発する企業向けに調整された総合的なプラットフォームであり、推論の実行に Picasso を採用しました。 また、クリエイティブ スタジオ Cuebric  は、没入型の仮想環境を構築するためのPicassoを活用した生成 AI アプリケーションを開発することで、映画制作とコンテンツ制作を強化しています。

世界最大の技術力を持つクリエイティブ グループであるAccenture Songは、Omniverseプラットフォームを使用して、マーケティング目的でコンピュータ支援設計データ(CADデータ)から忠実度の高い Defender 車両を生成しています。Accenture Songは、Edifyが提供する生成AIマイクロサービスと組み合わせることで、会話によるプロンプトを通じて、映画のようなインタラクティブな3D環境の作成を可能にします。その結果、リアルに生成された環境と Defender 車両のデジタルツインが調和した、完全に没入感のある3Dシーンが完成しました。

Speedy 3D: Shutterstock 3D AI ジェネレーターが早期アクセス開始

Shutterstock の 3D AI サービスは早期アクセスで利用可能であり、クリエイターはセットの装飾やアイデア作成のための仮想オブジェクトを生成できます。 この機能により、シーンのプロトタイプ作成に必要な時間が大幅に短縮され、アーティストはヒーロー キャラクターやオブジェクトに集中できる時間が増えます。

ビデオ提供:Shutterstock – Shutterstockの3Dジェネレーター

このツールを使用すると、クリエイティブのプロフェッショナルは、テキスト プロンプトや参照画像からアセットを迅速に作成し、一般的な 3D フォーマットの中から選択してファイルをエクスポートできるようになります。 Edify 3D ベースのサービスには、生成されたコンテンツをフィルタリングするための安全装置も組み込まれています。

商業的に安全なモデルは、Shutterstock のライセンスデータに基づいてトレーニングされました。 Shutterstockは、コンテンツIPが生成技術のトレーニングにおいて果たした役割に対し何十万人ものアーティストに補償しており、さらに数百万人への支払いが見込まれています。

画像提供:Shutterstock – Shutterstock 3D AI ジェネレーターを使用して作成されたアセットは、フラットレイ イメージとしてレンダリングおよび配置される。

GTC では、HP と Shutterstock が、Edify 3D を使用してカスタム 3D プリンティングを強化するコラボレーションを紹介し、デザイナーに無限のプロトタイプ オプションを提供します。

Shutterstock の 3D AI ジェネレーターを使用すると、デザイナーはコンセプトを迅速に反復し、HP が自動化されたワークフローを通じて 3D プリント可能なモデルに変換できるデジタル アセットを作成できます。 HP 3D プリンターはこれらのモデルを物理的なプロトタイプに変換し、製品設計のインスピレーションに役立てます。

Mattelは、Shutterstockの3D生成AI機能を利用することで、デザイン アイデア プロセスを加速できます。AIツールを使えば、玩具デザイナーは新製品のアイデアを簡単なテキスト説明で視覚化できる。忠実度の高いコンセプトデザインを作成するための技術的障壁を下げることで、デザイナーはより幅広いアイデアを検討し、より迅速に反復することができます。

Shutterstock は、テキストまたは画像プロンプトから生成された 360 HDRi 環境を使用して 3D シーンをライティングするための Edify ベースのツールも構築しています。

Dassault Systèmesは、3D コンテンツ作成用の主要な 3DEXCITE アプリケーションを通じて、CGI スタジオ Katana と、Universal Scene Description (OpenUSD) ベースの 3D ワークフローおよびアプリケーションを開発するためのコンピューティング プラットフォームである NVIDIA Omniverse に基づくワークフローに、Shutterstock 生成 360 HDRi API を組み込んでいます。

コントロールを確立: Getty Images のカスタム ファインチューニングでクリエイティブなビジョンを現実に変える

Getty Imagesは、商業的に安全な生成 AI サービスを通じて提供される機能を拡張し続け、ユーザーが生成したコンテンツに対する補償を提供します。

1 月の CES で、Getty Imagesは、画像内のオブジェクトを追加、削除、置換し、クリエイティブ キャンバスを拡張するためアウトペイントもする、Edify を利用したインペイント用API をリリースしました。 これらの機能は、Gettyimages.com と iStock.com の両方で利用できるようになりました。

Getty Imagesは 5 月から、企業のブランドやビジュアル スタイルに合わせて Edify 基盤モデルをカスタムファインチューニングするサービスも提供します。

このサービスは、企業が独自のデータセットをアップロードし、自動生成されたタグを確認し、ファインチューニング タスクを送信して、本番環境に展開する前に結果を確認するノーコードのセルフサービス方式を特徴としています。

カスタム ファインチューニング ツールの一部として、Getty Imagesは、生成 AI における最大の課題の 1 つである画像出力をより詳細にコントロールする API のコレクションをリリースします。

開発者は間もなく、スケッチ、深度、セグメンテーション機能にアクセス可能になります。これにより、ユーザーは AI の画像生成をガイドするスケッチを提供できるようになります。 深度マップを介して参照画像の構成をコピーし、画像の一部を分割して、文字やオブジェクトを追加、削除、またはレタッチができます。

Getty Images の API サービスは、以下を含む主要なクリエイティブや広告主によってすでに使用されています。

  • 株式会社電通: 日本を拠点とする広告代理店は、Getty Imagesの生成AI APIサービスを利用して、マーケティング用途にマンガやアニメ スタイルのコンテンツを作成できるアプリ 「MAFA: Manga Anime For All」 を開発しました。また、電通クリエーティブは、NVIDIA Picassoを使用して、大手会員制倉庫小売業者Sam’s Club向けのGetty Imagesのモデルをファインチューニングしています。
  • McCann: このクリエイティブエージェンシーは生成 AI を利用して、クライアントである Reckitt の市販風邪薬 Mucinex 向けに、顧客がブランドのマスコットと対話できる革新的なゲームの開発を支援しています。
  • Refik Anadol Studio: アートワークに生成 AI を使用することで知られるこのスタジオは、GTC で熱帯雨林にインスピレーションを得たアート インスタレーションを展示しました。このインスタレーションは、Refik の熱帯雨林カタログで微調整されたGetty Imagesの AI モデルを使用して作成されました。
  • WPP: このマーケティングおよびコミュニケーション サービス会社は、Coca-Cola Companyと提携して、Getty Imagesのモデルをファインチューニングすることで、ブランド スタイルとガイドラインを満たすカスタム ビジュアルを構築する方法を探求しています。
Large Nature Mode: Refik Anadol StudiosによるGTC2024でのインスタレーション「Living Archive」

NVIDIA Picasso の詳細については、ai.nvidia.com で Getty Images と Shutterstock の Edify 搭載 NIM をお試しください。

カリフォルニア州サンノゼで 3 月 21 日木曜日までオンラインで開催されたグローバル AI 開発者カンファレンスである NVIDIA GTC で、生成 AI の最新情報をアーカイブ視聴ください。

NVIDIA の創業者/CEO であるジェンスン フアン (Jensen Huang) による GTC の基調講演を以下でご覧ください。

上部のコラージュは、左側の Edify を利用した Shutterstock 3D AI ジェネレーターによって作成されたアセットを示しています (提供:Shutterstock)。 右側の画像は、NVIDIA がデモを行った Edify のスケッチから画像への機能を示しています。