レコメンダー システムとは?

投稿者: Brian Caulfield

ディープラーニング ベースのレコメンダー システムは、大手オンライン企業の成長を牽引しています。そして今、NVIDIA Merlin アプリケーション フレームワークと GPU アクセラレーションにより、レコメンダー システムを誰もが利用できるようになりつつあります。

ネットで検索すれば欲しいものが見つかるかもしれません。

しかし、オンラインで十分な時間を過ごせば、あなたが欲しいものが、ちょうど必要とするときに見つかるようになるでしょう。

これが、現在のインターネットの原動力です。

その正体はレコメンダー システムと呼ばれる、現在、最も重要なアプリケーションの 1 つです。

なぜなら、選択肢は爆発的に増えていて、利用可能な選択肢の膨大な数を調べるのは不可能だからです。

買い物客がモバイル アプリで 1 回スワイプするのに 1 秒しかかからないとしても、大手 e コマース サイトに掲載されている 20 億種類の商品すべてを見て回るのに 65 年もかかります。これでは、人生のほとんどを費やしてしまいます。

これが、インターネットでこれほどまでにパーソナライズが進んだ主な理由の 1 つです。パーソナライズしなければ、世界で数十億人に上るインターネット ユーザーが、無数の物の中から自分にとって重要な商品やサービス、あるいは専門知識にたどり着くのは絶対に不可能です。

レコメンダー システムは、非常に人間的とも言えるかもしれません。というのも、誰かにアドバイスを受けるとき、人はいったい何を行うでしょう?フィードバックが欲しい時はどうでしょうか?推薦を求めていませんか。

現在では、レコメンダー システムは、何億人にもおよぶ個々のユーザーの好みに関する膨大な量のデータをもとに、より適切なレコメンデーションを提供するためにデータを高速で処理しています。

インターネット上では当然、人の名前や住所、もしかしたら出身地など、さまざまな情報がすでに把握されています。しかし、レコメンダー システムが、おそらく周りの知人よりもその人について深く学習しようとしているのは、その人の好みに関することです。

レコメンダー システムの導入をお考えの場合、NVIDIA が提供するディープ レコメンダー システム向けアプリケーション フレームワークの NVIDIA Merlin について詳細をご覧ください

Web で最も成功している企業の成功への鍵

レコメンダー システムのアイデアそのものは新しいものではありません。ユッシ カールグレン (Jussi Karlgren) 氏は、1990 年にレコメンダー システムのアイデアである「デジタル ブックシェルフ」を考案しました。その後 20 年間にわたり、MIT と Bellcore の研究者がその技術を着実に進化させました。

このテクノロジが実際に広くイメージを持たれるようになったのは、2007 年、Netflix (当時は郵便を使った DVD のレンタル業を行っていました) が協調フィルタリング アルゴリズムの公開コンテストを開始したのが始まりです。Netflix の独自システムの精度を 10% 以上向上させると賞金 100 万ドルを獲得でき、賞金が授与されたのは 2009 年のことです。

その後 10 年間、同様のレコメンダー システムは、Netflix、Amazon、Facebook、Baidu、Alibaba など、インターネット企業の成功に欠かせないものとなりました。

データの好循環

そして、最新世代のディープラーニングを活用するレコメンダー システムは驚くべきマーケティング効果を生み出し、企業が提供する商品に関心を示しそうなユーザーにうまく狙いを絞ることで、クリック率を急上昇させることができるようになりました。

現在、このようなデータを収集、処理、使用して AI モデルを学習し、このモデルを展開して、一般の人々が欲しいものを見つけられるようになっています。これは、トップのインターネット企業が持つ最大の競争優位性の 1 つです。

この機能が、好循環を推進しています。それを実現するのは、優れたレコメンデーションを駆動する最高のテクノロジです。つまり、このレコメンデーションがより多くの顧客を惹きつけ、最終的にトップ企業はさらに優れたテクノロジにお金をかけることができます。

これがビジネス モデルです。では、このテクノロジがどのように機能するのか見てみましょう。

情報の収集

レコメンダーは、ユーザーが何を求めているか、動画ストリーミング アプリに伝えた見たい映画、投稿した評価やレビュー、購入した内容、その他、過去に取った行動などを記録し、情報を収集することによって機能します。

より重要なのは、レコメンダーが、ユーザーの過去の選択、つまり、何をクリックしてどのように移動したかを追跡できる点でしょう。例えば、特定の映画をどのくらいの時間視聴したか、どの広告をクリックしたか、どの友人と交流したか、などです。

このような情報すべてが巨大なデータ センターに流れ、急速に大きく膨れ上がる複雑な多次元テーブルにコンパイルされます。

それらは何百テラバイトもの大きさになり、常に増加し続けています。

これは、大量のデータが一個人から収集されているからというよりも、小さなデータがきわめて多数の人々から収集されているからです。

言い換えれば、テーブルのデータは非常にまばらです。これらのサービスのほとんどが、これらのカテゴリーについて、私たちのほとんどについて持っている情報は、ほとんどゼロです。

しかし、これらのテーブルをまとめると、多くの人々の好みに関する大量の情報になるのです。

企業はこの情報を利用して、特定のタイプのユーザーの好みについてインテリジェントな判断を行います。

コンテンツ フィルタリングと協調フィルタリング

レコメンダーのアルゴリズムと技法は沢山ありますが、その多くが大まかに 2 つのカテゴリーに分けられます。協調フィルタリングとコンテンツ フィルタリングです。

協調フィルタリングは、自分と似たようなユーザーを探すことで、自分の好きなものを見つけるのに役立ちます。

つまり、あなたの音楽の好みに関してはレコメンダー システムが何も知らない場合でも、あなたと別のユーザーの本の好みが似ていることが分かれば、この別のユーザーがすでに気に入っていると分かっている曲をお勧めできるかもしれません。

対照的にコンテンツ フィルタリングは、各製品の基本的な特徴を理解することで機能します。

つまり、映画「ユー ガット メール」や「めぐり逢えたら」が好みであることをレコメンダーが分かると、「ジョー、満月の島へ行く」など、トム ハンクス (Tom Hanks) とメグ ライアン (Meg Ryan) が出演している別の映画をお勧めできるかもしれません。

もちろんこれらは非常に単純化した例です。

競争優位性としてのデータ

現実に、このようなシステムはきわめて多くの人々から膨大な量のデータを収集し、桁外れの規模で展開されるため、システムのレコメンデーションを少し改善するだけでも、数千万ドル、いや数億ドル規模のビジネスを動かすことができます。

一個人が何をしようとしているかを企業が知らなくても、大数の法則を利用して知ることができるのです。例えば、あるサービスが 100 万人に紹介されれば、1%の人は購入するでしょう。

優れたレコメンデーション システムは大きなメリットをもたらす可能性がありますが、課題も同様に大きくなります。

例えば、成功しているインターネット企業は、これまで以上に多くのクエリを迅速に処理する必要があるため、処理するデータ量が増え続けるのに合わせて、莫大な予算をかけてインフラを維持しなければなりません。

対照的に、テクノロジ業界以外の企業は、データ サイエンティストのチームを丸ごと雇う必要がないように、既製のツールを利用する必要があります。

ヘルスケア サービスから金融サービスにいたるまで、幅広い業界でレコメンダーが活用されるようになるには、レコメンダーをより利用しやすくする必要があります。

GPU アクセラレーション

そこで GPU の出番です。

ご存じのとおり、NVIDIA GPU は、その並列処理能力で大量のデータを扱うタスクを処理できるようになって以来、ニューラルネットワークの学習時間の短縮のために長い間利用されており、近ごろの AI ブームの火付け役となっています。

しかし現在では、収集されるデータの量は増え続け、GPU の利用範囲が拡大しています。データ サイエンスと分析のパイプラインを大幅に高速化するためのソフトウェア ライブラリ群であるRAPIDSなどのツールを利用して、データ サイエンティストはより多くの作業をより迅速に行うことができます。

そして、NVIDIA から発表されたばかりの Merlin レコメンダー アプリケーション フレームワークは、取り込みから学習、展開までのエンドツーエンドのパイプラインで、GPU 高速化されるレコメンダー システムを利用しやすくすることを約束します。

これらのシステムでは、NVIDIA Ampere アーキテクチャに基づいて構築された新しい NVIDIA A100 GPU を活用できるため、企業はこれまで以上に迅速かつ経済的にレコメンダー システムを構築できます。

さて、私たちのレコメンド、つまりお勧めは何でしょうか? もしあなたがレコメンダー システムの導入をお考えなら、今すぐ着手することをお勧めします。

レコメンダー システムの導入について、まずは NVIDIA が提供するディープ レコメンダー システム向けアプリケーション フレームワークの NVIDIA Merlin について詳細をご覧ください。

掲載画像元: © Monkey Business – stock.adobe.com.