Expedia における AI の活用: 閲覧者に最適な写真を表示する取組み

投稿者: Jamie Beckett

人は第一印象が肝心です。それはホテルも同様です。

そこで、旅行業界大手の Expedia は、ホテルが閲覧者に合った写真を表示できるようにするため、AI を活用しています。旅行者が場所に対して抱く印象は 1 秒未満で決まります。つまり、そうした写真はインスタグラム映えするものの方がよいということです。

Expedia のデータ科学担当ディレクターのヌーノ カストロ (Nuno Castro) 氏は、次のように述べています。「人間の脳は、画像を最初に処理するよう神経回路が形成されています。画像が好きかどうかは一目でわかります。」

カストロ氏は、エクスペディア社の企業間パートナーシップのブランド「Expedia Affiliate Network」で、GPU アクセラレーションによるディープラーニングと画像認識を使用して最も魅力的なホテルの写真を自動的に選択し、いつ、どれを表示するかを決定するシステムを開発するチームを率いています。

「画像の順序が重要です。モバイルデバイスで閲覧している場合や急いでいる場合は特にそうです。ロビーの写真しかなければ、結局は他のホテルを予約することになるかもしれません」(カストロ氏)

まずはジム、次にプール

Expedia には、アフィリエイト ネットワークに登録している 30 万軒のホテルの写真が 1,000 万枚あります。各ホテルの最も重要な写真は手作業で選びますが、ホテルごとにすべての画像について一々そうすることは無理があります。他の写真はランダムに選別するか、内容によって分類していますが、理想的な結果が得られないことがあるとカストロ氏は語ります。

「部屋が清潔かどうかを確認するためにバスルームを見たいという人もいますが、最初に表示する画像として最適とは言えません。」(カストロ氏)

AI を活用すれば、眺めのよい部屋といった、より魅力的な写真を閲覧者に表示できる可能性が高まります。 Expedia が 2014 年に実施した調査によれば、旅行者は窓からの眺めを掲載しているホテルに対して比較的好印象を抱いています。

しかし、カストロ氏はバスルームの前にビーチの眺めを表示する以上のことを AI にさせたいと考えており、現在は顧客タイプに合わせて画像を変更するディープラーニング モデルに取り組んでいます。ビジネス客は、プールの写真よりもジムの写真を見たいと思うかもしれませんが、ファミリ客には逆のことが言えます。

リゾートホテルのプール サイドの写真
Expedia は、ディープラーニングを活用することにより、ファミリ客にはオフィス センターではなくプールを見せるといった具合に、客層に合わせて表示するホテルの写真を変更したいと考えています。

最高の写真のスコア付け

Expedia は、ローカルの GeForce GTX GPU と Amazon Cloud の NVIDIA Tesla GPU アクセラレータを使用して、ニューラル ネットワークのトレーニングと展開を行いました。カストロ氏と彼のチームはまず、Expedia が保有する 10 万枚のホテルの写真に対する評価をクラウド ソーシングすることでデータセットを構築しました。テスターが各画像を 6 回ずつ評価することにより、50 万の画像スコアが得られました。

次に、VGG16 という学習済み畳み込みニューラル ネットワークを、各画像を 1,000 種類の画像カテゴリのいずれかに分類するよう学習させました。このネットワークは、一緒に写っている可能性が高い物体 (飲み物、テーブル、レストランなど) の予測も行います。さらに、元のクラウド ソーシングした最初の評価と一致するよう、ディープラーニング モデルをトレーニングしました。

モデルの実行は 1 日で完了しました。

ホテル検索を簡単に

カストロ氏は、本格展開を開始する前にさらに多くのデータで実験してモデルを微調整し、テストする必要があると述べています。Expedia は、Expedia ブランドのサイトとアフィリエイト ネットワーク以外にも、Hotels.com、trivago、Orbitz、Hotwire などを所有しています。

「ホテルの写真を見て回るのは非常に時間がかかります。当社は、旅行者がそれぞれに最適なホテルを最も効率的な方法で探していただけるようにしたいと考えています。これはまだ実験段階にすぎませんが、その目標に対する当社のコミットメントを物語っています。」(カストロ氏)

詳しくは、下記のビデオ (PyData London 2017 におけるヌーノ カストロ氏の講演) をご覧ください。