NVIDIA RTX が LTX-2 と ComfyUI のアップグレードにより PC での 4K AI ビデオ生成を高速化

2025 年は PCにおける AI 開発にとって飛躍の年となりました。

PC クラスの小規模言語モデル (SLM) の精度は 2024 年と比較して約 2 倍向上し、最先端のクラウドベースの大規模言語モデル (LLM) との差を劇的に縮めました。Ollama、ComfyUI、llama.cpp、Unsloth などの AI PC 開発ツールは成熟し、その人気は前年比で倍増しました。また、PC 向けモデルをダウンロードするユーザー数も 2024 年から 10 倍に増加しました。

これらの進展により、2026 年は、PC クリエイター、ゲーマー、そして生産性向上を目指すユーザーの間で、日常生活における生成 AI が広く普及する道が開かれています。

今週開催の CES において NVIDIA は、GeForce RTX、NVIDIA RTX PRO、NVIDIA DGX Spark デバイス向けの AI アップグレードを順次発表します。これらのアップグレードは、開発者が PC 上で生成 AI を展開するために必要なパフォーマンスとメモリ容量を解放します。主な内容は以下のとおりです。

ComfyUI における PyTorch-CUDA の最適化とネイティブ NVFP4/FP8 精度サポートにより、ビデオおよび画像生成 AI のパフォーマンスを最大 3 倍向上し、VRAM 使用量を 60% 削減します。
ComfyUI への RTX Video Super Resolution の統合により、4K ビデオ生成を高速化します。
Lightricks の最先端 LTX-2 音声ビデオ生成モデルのオープンウェイトリリース向けの NVIDIA NVFP8 最適化。
Blender の 3D シーンを使用して 4K AI ビデオを生成し、出力を正確に制御するための新しいビデオ生成パイプライン。
Ollama および cpp を使用した SLM の推論パフォーマンスの最大 35% 高速化。
Nexa.ai の Hyperlink の新しいビデオ検索機能向けの RTX アクセラレーション。

これらの進歩により、ユーザーは、ローカル RTX AI PC が提供するプライバシー、セキュリティ、低遅延を活用しながら、高度なビデオ、画像、言語の AI ワークフローをシームレスに実行できるようになります。

RTX PC で 3 倍高速かつ 4K でビデオを生成

生成 AI は素晴らしいビデオを作成できますが、オンラインツールをプロンプトだけで操作するのは困難です。また、ほとんどのモデルは PC の VRAM に収まらないほど大きいため、4K ビデオの生成はほぼ不可能でした。

NVIDIA は本日、RTX を活用したビデオ生成パイプラインを発表します。このパイプラインにより、アーティストは生成プロセスを正確に制御しながら、ビデオ生成を 3 倍高速化し、4K にアップスケールすることができます。しかも、VRAM の使用量は非常に少なくなります。

このビデオ生成パイプラインにより、新進のアーティストはストーリーボードを作成し、それをフォトリアルなキーフレームに変換し、高品質の 4K ビデオに変換できます。このパイプラインは 3 つの Blueprint に分かれており、アーティストはニーズに合わせてこれらを組み合わせたり、調整したりできます。

シーンのアセットを作成する 3D オブジェクトジェネレーター。
ユーザーが Blender でシーンを設定し、そこからフォトリアルなキーフレームを生成できる 3D ガイド付き画像ジェネレーター。
ユーザーの開始キーフレームと終了キーフレームに従ってビデオをアニメーション化し、NVIDIA RTX Video テクノロジを使用して 4K にアップスケールするビデオジェネレーター。

このパイプラインは、本日ダウンロード可能となった Lightricks の新しい LTX-2 モデルの画期的なリリースによって実現しました。

ローカル AI ビデオ作成における大きなマイルストーンとなる LTX-2 は、主要なクラウドベースモデルに匹敵する結果を提供しながら、最大 20 秒間の 4K ビデオを優れた視覚的忠実度で生成します。このモデルは、組み込みオーディオ、マルチキーフレームのサポート、そして制御可能な低ランク適応 (LoRA) によって強化された高度な条件付け機能を備えており、クリエイターはクラウド依存に頼らずに映画レベルの品質と制御性を実現できます。

内部的にパイプラインは ComfyUI によって動作しています。過去数か月にわたり、NVIDIA は ComfyUI と緊密に連携し、NVIDIA GPU のパフォーマンスを 40% 最適化してきました。最新のアップデートでは、NVFP4 と NVFP8 のサポートが追加されました。RTX 50 シリーズの NVFP4 フォーマットでは、パフォーマンスが 3 倍高速化し、VRAM が 60% 削減されます。また、NVFP8 フォーマットでは、パフォーマンスが 2 倍高速化し、VRAM が 40% 削減されます。

NVFP4 および NVFP8 のチェックポイントは、一部の主要モデルで ComfyUI から直接利用することができます。対象となるモデルには、Lightricks の LTX-2、Black Forest Labs の FLUX.1 および FLUX.2、Alibaba の Qwen-Image および Z-Image が含まれます。これらのモデルは ComfyUI から直接ダウンロードできます。近日中に、その他のモデルのサポートも開始される予定です。

ビデオクリップが生成されると、ComfyUI の新しい RTX Video ノードを使用して、数秒でビデオが 4K にアップスケールされます。このアップスケーラーはリアルタイムで動作し、エッジをシャープにし、圧縮アーチファクトを除去して、クリアな最終画像を実現します。RTX Video は来月 ComfyUI で利用可能になります。

ユーザーが GPU メモリの限界を超えられるよう、NVIDIA は ComfyUI と連携し、ウェイトストリーミングと呼ばれるメモリオフロード機能を改良しました。ウェイトストリーミングを有効にすると、ComfyUI は VRAM が不足したときにシステム RAM を使用できるようになり、ミッドレンジの RTX GPU でより大規模なモデルとより複雑な多段ノードグラフを実現できます。

ビデオ生成ワークフローは来月ダウンロード可能になります。新たにリリースされた LTX-2 ビデオモデルのオープンウェイトと ComfyUI RTX アップデートは現在利用可能です。

PC ファイルと動画の新しい検索方法

PC でのファイル検索は数十年も変わっていません。依然としてファイル名と不完全なメタデータに大きく依存しており、昨年の文書を探すことは、本来あるべき姿よりもはるかに困難です。

Nexa.ai のローカル検索エージェント「Hyperlink」は、RTX PC を自然言語で質問にインライン引用を付きで答えることができる検索可能なナレッジベースへと変換します。文書、スライド、PDF、画像をスキャンしてインデックスを作成できるため、ファイル名を推測することなく、アイデアやコンテンツに基づいた検索が可能になります。すべてのデータはローカルで処理され、プライバシーとセキュリティのためにユーザーの PC 上に保存されます。さらに、RTX アクセラレーションにより、テキストファイルと画像ファイルのインデックス作成は 1GB あたり 30 秒、応答は RTX 5090 GPU で 3 秒しかかかりません。一方、CPU ではファイルのインデックス作成に 1GB あたり 1 時間、応答に 90 秒かかります。

Nexa.ai は CES にて、Hyperlink の新しいベータ版を発表します。このベータ版ではビデオコンテンツのサポートが追加され、ビデオ内のオブジェクト、アクション、音声を対象に検索できるようになります。これは、B ロールを探しているビデオアーティストから、バトルロイヤルの試合で勝利した瞬間を見つけて友人と共有したいゲーマーまで、幅広いユーザーにとって理想的なツールです。

Hyperlink のプライベートベータ版をお試しになりたい方は、こちらのウェブページでアクセス登録を行ってください。アクセスは今月から開始されます。

小規模言語モデルが 35% 高速化

NVIDIA はオープンソースコミュニティと連携し、llama.cpp と Ollama を使用することで、RTX GPU および DGX Spark デスクトップスーパーコンピューター上での SLM の大幅なパフォーマンス向上を実現しました。最新の変更は、新しい NVIDIA Nemotron 3 ファミリーのオープンモデルを含む、Mixture-of-Experts モデルに特に効果的です。

過去 4 か月間で、SLM の推論パフォーマンスは llama.cpp で 35%、Ollama で 30% 向上しました。これらのアップデートは現在利用可能であり、llama.cpp には LLM の読み込み時間を短縮する利便性向上アップグレードも含まれています。

これらの高速化は、LM Studio の次回のアップデートで利用可能になり、新しい MSI AI Robot アプリなどのエージェント型アプリにも近日中に導入される予定です。llama.cpp の最適化も活用する MSI AI Robot アプリでは、ユーザーが MSI デバイスの設定を制御でき、今後のリリースで最新のアップデートが組み込まれる予定です。

NVIDIA Broadcast 2.1 がより多くの PC ユーザーにVirtual Key Lightを提供

NVIDIA Broadcast アプリは、AI エフェクトによりユーザーの PC マイクとウェブカメラの音質を向上させ、ライブストリーミングやビデオ会議に最適です。

バージョン 2.1 では、Virtual Key Light エフェクトが更新され、パフォーマンスが向上しました。これにより、RTX 3060 デスクトップ GPU 以上で利用可能になり、より多くの照明条件に対応し、より幅広い色温度制御が可能になりました。また、プロのストリーミングでよく見られる 2 灯キーライトスタイルを実現するために、更新された HDRi ベースマップの使用が可能になります。NVIDIA Broadcast のアップデートを今すぐダウンロードしてください。

DGX Spark で自宅のクリエイティブスタジオを AI の拠点に

毎月、高性能で新しい AI モデルが PC に登場し、より強力で柔軟なローカル AI 環境への開発者の関心が高まり続けています。DGX Spark は、ユーザーのデスクに収まり、メインのデスクトップ PC やノート PC とシームレスに連携するコンパクトな AI スーパーコンピューターです。既存の PC と連携して、高度な AI ワークロードの実験、プロトタイピング、実行を可能にします。

Spark は、LLM のテストやエージェント型ワークフローのプロトタイピングに関心のある方、あるいはワークフローと並行してアセットを生成し、メイン PC で編集作業を継続したいアーティストにとって最適です。

NVIDIA は CES で、Spark の AI パフォーマンスに関する主要なアップデートを発表しました。これにより、発売からわずか 3 か月弱で、最大 2.6 倍のパフォーマンス向上が実現します。

投機的デコーディング向けや、2 つの DGX Spark モジュールを使用してモデルをファインチューニングするためのプレイブックなどが含まれている新しい DGX Spark プレイブックも利用可能です。

Facebook、Instagram、TikTok、X で NVIDIA AI PC をフォローしてください。また、RTX AI PC ニュースレターに登録して最新情報を入手してください。LinkedIn と X でNVIDIA Workstationをフォローしてください。

ソフトウェア製品情報については、お知らせをご覧ください。

RTX PC で 3 倍高速かつ 4K でビデオを生成

PC ファイルと動画の新しい検索方法

小規模言語モデルが 35% 高速化

NVIDIA Broadcast 2.1 がより多くの PC ユーザーにVirtual Key Lightを提供

DGX Spark で自宅のクリエイティブ スタジオを AI の拠点に

DGX Spark で自宅のクリエイティブスタジオを AI の拠点に