特定の精神疾患の診断からテキストにおける画像配置の最適化まで、アイ・トラッキングは、心理学、医学、広告、マーケティングなど、さまざまな分野で役立っています。
科学者や研究者は、人々はどこを見るのか、なぜ見るのかを理解すると、多くを学ぶことができます。しかし、アイ・トラッキングをあらゆる場所で容易に行うのは困難でした。ディープラーニングとNVIDIAのGPUが、それを変えようとしています。
モバイルのアクセスを活用
アイ・トラッキングには大きな可能性がありますが、研究者は、視線を追うのが思っていたより簡単でないことに悩まされてきました。「私たちは、誰もアイ・トラッカを持っていないことにとても驚きました。」 MITの電気工学およびコンピュータ・サイエンス学部の、コンピュータ・サイエンスと人工知能の研究室に通う大学院生であるアディティア・コースラ(Aditya Khosla)氏は言います。
コースラ氏の他、米国のジョージア大学およびドイツのザールブリュッケンでインフォマティクスを扱うマックス・プランク研究所に在籍する6人の研究者によるチームは、確実な目標到達に向けて行動を開始しました。その目標とは、カメラ付き携帯電話で稼働するアイ・トラッキング・ソフトウェアの作成です。
強力なモバイル・テクノロジと、膨大な数のユーザが利用できるようにする性能の融合は、このチームにとってきわめて魅力的なものでした。
プロジェクト開始時に、ジョージア大学でコンピュータ・サイエンスの大学院学位の取得を終えるところだった、Googleのソフトウェア・エンジニアであるカイル・クラフカ(Kyle Krafka)氏はこう言います。「もしアイ・トラッキングを行うのに、研究室にあるような大きな装置が必要だとしたら、少数のユーザしか利用できないでしょう」
GPUは、このチームの製品において、重要な位置を占めていました。この製品は、Caffeディープラーニング・フレームワークと組み合わせたNVIDIA GeForce GTX TITAN X を頼りにしており、ニューラル・ネットワークのトレーニングと推論の両方のためのもので、チームはiTrackerと名付けました。
クラフカ氏によると、NVIDIAのGPUグラント・プログラムからこのプロジェクトに寄付されたTITAN Xにより、クラフカ氏とコースラ氏は、並列プロセッシングを利用し、数百にのぼるモデルを実行できたそうです。CPUでは不可能だったでしょう。
クラフカ氏は言います。「おかげで、迅速に実験したり、新しいアイデアを試したり、何がうまくいって何がそうではないのかを見つけることができました」
データ、もっと多く
しかし、iTrackerを訓練するために、チームはデータを必要としていました。彼らはまったく新しいアプローチを採用し、データを取得しました。人工知能のクラウドソーシング・マーケットプレイスの一種であるAmazon Mechanical Turkの利用です。これにより、研究室の従来のアプローチで得られるよりも、さらに大規模なデータセットを収集できました。
コースラ氏は言います。「参加を容易にする方法を見つけたので、データセットの供給も増え、得られた知見も拡がりました。」 Amazon Mechanical Turkを利用し、チームは、アイ・トラッキングのデータセットを約1,500人の参加者から収集できました。この人数は、過去の研究と比べても30倍の数です。
この画期的なデータセットは、次にiTrackerのトレーニングに利用されました。TITAN Xを利用し、このトレーニングでは、モバイル・デバイスにおいてリアルタイムでiTrackerを実行できることが実証されました。そして、以前のアプローチよりも大幅に精度が向上しました。
コースラ氏によると、このチームは現在アプリに取り組んでいますが、このテクノロジを商品化するかどうかはまだ決めていません。とりあえず、開発者コミュニティに対してこの製品をオープン・ソース化し、成果を確認することを計画しているそうです。
詳細は、プロジェクトのウェブサイトをご覧ください。