クロスワード・パズルの答えをこっそり教えてほしい――そんな皆さまに朗報です。人工知能(AI)が希望をかなえます。
3つの大学から集まった研究者チームが、AIの一種であるディープラーニングを利用して、コンピュータによる言語理解の迅速化と効率化を支援するシステムを設計しました。また、その一環として、クロスワードのヒントがとりわけ難解な場合に役立つ、Webベースのツールも開発しました。
ケンブリッジ大学の博士論文提出資格者であり、この研究に関する論文の主執筆者を務めたフェリックス・ヒル(Felix Hill)氏は、次のように述べています。「このクロスワードのお助けツールは、ディープラーニングがいかにコンピュータの言語理解能力を向上させるかを示すデモに過ぎません。コンピュータにとって、言語の学習は難題です。人間が話し方や読み方を学ぶときに得られる豊富で多様な情報を、コンピュータが再現するのは容易ではありません」
研究者チームは、コンピュータがフレーズを理解できるようにすることに重点を置きました。コンピュータは単語を理解することがとても得意ですが、「世の中の役立つ情報のほとんどはフレーズでやりとりされているのです」とヒル氏は言います。
ニューラルネットワークのトレーニング
同チームは、個々の単語の意味を理解するコンピュータと、フレーズや文章の意味を理解できるコンピュータとの隔たりを埋める方法として、ディープラーニングに注目しました。ディープラーニングでは、人間の能力を再現するため、大量のデータから自然に学習できる人工ニューラルネットワークのトレーニングを行います(「GPUによるAIの高速化――新たなコンピューティング・モデルの誕生」を参照)。
辞書6冊とWikipediaの定義に基づいてニューラルネットワークのトレーニングを行った研究者チームは、そのプロセスにNVIDIAのGeForce GTX TITAN Black GPUを採用し、何十万個もの定義の処理に必要なスピードを実現しました。これにより、トレーニング期間が数日から約10時間にまで短縮されたとヒル氏は語っています。
「私たちのシステムは、トレーニングで使用した辞書データを大きく超えることはできませんが、できることに目を向けると実に興味深いものがあります。そこから、驚くほど優れたQ&Aシステムが生まれたんです。クロスワード・パズルを解くのが非常に得意なんですよ」
さらなる学習へ
このディープラーニング・システムは、論理的飛躍が必要な、語呂合わせや抽象的な質問が特に得意なわけではありませんでした。しかし、論文によると、このシステムは、一般的なクロスワードのヒントに答えるテストで、クロスワード用に考案された市販商品より高い能力を発揮しました。
そこで、どの程度答えられるかを検証するため、全米の新聞に30年以上配信されているクロスワードの作家であるメール・リーグル(Merl Reagle)氏のパズルから、いくつかのヒントをこちらのオンライン・ツールに投げかけてみました。
ツールは、一部のわかりやすいヒントに対しては簡単に答えを返しました。たとえば、「deterioration」(低下)は、確かに「gradual decline」(徐々に悪化すること)を示す13文字の単語であり、「Edam」(エダム)は、オランダのチーズの一種です。しかし、「looked up to」(敬われる)や「fearful one」(気の弱い人)などのヒントには答えられませんでした。ちなみに、答えはそれぞれ、「respected」(尊敬される)と「scaredycat」(弱虫)です。
辞書とWikipediaによるトレーニングを終えても、ディープラーニング・システムに文化的意識が隅々まで行き渡るわけではありません。たとえば、ツールは、「epic film of 1979?」(1979年の大作映画は?)に対する答えとして、「Iliad」(イーリアス)や「Beowulf」(ベオウルフ/呪われし勇者)といった文学大作を挙げましたが、「Apocalypse Now」(地獄の黙示録)を挙げることはありませんでした。また、「Flying Pan?」(パンはパンでも飛べるパンは何?)に対しては、さまざまな鳥や魚の名前を挙げましたが、ネバーランドから来た少年、つまり「Peter」(ピーターパン)はどうしても出てきませんでした。
ヒル氏は、今後の展望を次のように語ります。「次のステップは、さらに多くのデータを使用してニューラルネットワークのトレーニングを行い、最終的に人々との直接対話を取り入れることです。チームは、そのフィードバックに基づいてツールを改善できるでしょう」