誕生 40 周年を迎えるパックマンを、NVIDIA の研究者たちが AI で再現

投稿者: Isha Salian

パックマンの 5 万エピソードでトレーニングした敵対的生成ネットワークである GameGAN が、ドットを食べながら進む往年の名作をゲーム エンジンなしで、完全に再現

パックマンが日本のゲームセンターに初めて登場し、人気ゲームとして全世界を食べ尽くしてから 40 年が経った今、この名作レトロゲームが AI の力を借りて生まれ変わりました。

NVIDIA Research が作り上げ、5 万エピソードに基づいてトレーニングされた、パワフルな新しい AI モデルであるNVIDIA GameGANは、基本となるゲーム エンジンなしで、完全に機能するパックマンを生成することができます。つまり、ゲームの基本ルールを理解していなくても、AI がゲームを再作成して、満足のいく結果を出せるのです。

GameGAN は、敵対的生成ネットワーク (GAN) を活用してコンピューター ゲーム エンジンを模倣する、初のニューラルネットワーク モデルです。2 つの敵対するニューラルネットワークで構成される、GAN ベースのモデルは、オリジナルとして十分に通用すると思わせるような、新しいコンテンツを作成することを学びます。

NVIDIA の研究者であり、本プロジェクトの論文の主執筆者であるスンウク キム (Seung-Wook Kim) は、次のように話しています。「これは、GAN ベースのニューラルネットワークを使ってゲーム エンジンを模倣するという、初めての研究です。私たちは、ゲーム内を動いているエージェントのスクリーンプレイを見るだけで AI が環境のルールを学べるのかどうかを知りたかったのです。そして、AI にはそれができました。」

人工のエージェントが GAN の生成したゲームをプレイすると、GameGAN はエージェントのアクションに反応し、リアルタイムでそのゲーム環境の新しいフレームを生成します。GameGAN は、ゲームのスクリーンプレイをもとに、さまざまなレベルまたはバージョンでトレーニングを受ければ、実際には見たことのないゲームのレイアウトを生成することもできます。

この能力を利用すれば、ゲーム開発者は新しいゲーム レベルのレイアウトを自動的に生成できるようになり、AI 研究者は自律マシンのトレーニングのためのシミュレーター システムをもっと簡単に開発できるようになるでしょう。

パックマンを生み出した株式会社バンダイナムコエンターテインメントの研究開発会社であり、GameGAN のトレーニングのためにパックマンのデータを提供いただいた、株式会社バンダイナムコ研究所の堤康一郎氏は、次のように話しています。
「結果を見て、私たちはとても驚きました。アイコニックなパックマンの楽しさを、ゲーム エンジンもなしに AI が再現できるとは思ってもいませんでしたから。この研究は、ゲーム開発者が新しいレベルのレイアウト、キャラクター、さらにゲーム自体をも開発するという、クリエイティブなプロセスを加速できるようになる、魅力的な可能性を示しています」

NVIDIA は今年の後半、誰もが研究結果のデモを直接体験できる形での公開を予定しており、詳細はAI Playgroundにてお知らせする予定です。

AI で時代をさかのぼる

かつてパックマンのファンがこのクラシックな迷路ゲームをプレイするには、近くのゲームセンターに通わなければなりませんでした。ピンボール マシンのところを左に曲がり、エアホッケーのところを真っ直ぐ通り抜けると、パックマンがドットを食べながら、ゴーストのインキー、ピンキー、ブリンキー、クライドを避ける、独特のサウンドトラックが聞こえてきます。

1981 年だけでも、米国人はパックマンのようなコイン投入式のゲームをプレイするために、数十億枚の 25 セントコインを投入し、7 万 5,000 時間を費やしました。それから数十年後、この大ヒット ゲームには、PCやゲーム機、携帯電話でプレイするバージョンが生まれました。

GameGANの論文の主執筆者であるNVIDIAの研究者、
スンウク キム (Seung-Wook Kim)

GameGAN のバージョンでは、従来のゲーム エンジンではなく、ニューラルネットワークの活用によってパックマンの環境が生成されています。AI は、この仮想世界の記録を追いかけ、すでに生成されていたものを思い出し、各フレームを通じてビジュアルの一貫性を保とうとします。

どのようなゲームであっても、GAN は、過去のゲームプレイから画面の記録とエージェントのキーストロークを取り込むだけで、ゲームのルールを学ぶことができます。ゲーム開発者は、トレーニングのデータとしてオリジナルレベルのスクリーンプレイを利用して、このようなツールを使うことで、既存のゲームで新たなレベルのレイアウトを自動的にデザインすることができます。

トロントにある NVIDIA AI Research ラボで、キムと協力者たちはバンダイナムコ研究所から提供されたデータとNVIDIA DGX システム を用いて、パックマンのエピソード (合計数百万フレーム) とゲームをプレイした AI エージェントのキーストロークについてのデータをベースに、ニューラルネットワークのトレーニングを行いました。

その後、トレーニングを受けた GameGAN モデルは、一貫した迷路の形状やドット、パワークッキーのような環境の静的な要素、ならびにゴーストたちとパックマンそのもののといった動き回る要素をそれぞれ生成しました

GameGAN モデルは、シンプルなものでも、複雑なものでも、ゲームの主要なルールを学びます。オリジナルのゲームと同じように、パックマンは、迷路の壁を通り抜けることはできません。パックマンは、動き回りながらドットを食べます。パワークッキーを食べるとモンスターはブルーになり、逃走します。パックマンが迷路の横側から外に出ると、パックマンは反対側に瞬間移動します。パックマンがゴーストに捕まると、画面が点滅して、ゲームはおしまいです。

このモデルは動いているキャラクターと背景を別々に捉えることができるので、ゲームを作り直して、屋外の生け垣製の迷路を舞台にしたり、あるいはお気に入りの絵文字をパックマンの代わりにしたりすることも可能です。開発者は、この能力を使って、新しいキャラクターのアイデアやゲームのテーマを実験することができるでしょう。

ゲームのその先に

自律ロボットは通常、実際の世界での物体とのインタラクションに至る前に、AI が環境のルールを学ぶことのできる、シミュレーターでトレーニングされます。シミュレーターの作成は、物体がどのように相互作用するのか、ならびに光が環境内でどのように作用するのかというルールをコード化しなければならないため、開発者にとって時間を大量に消費するプロセスとなります。

シミュレーターは、物体を掴んで運搬する方法を学ぶ倉庫用ロボット、あるいは食料や医薬品を輸送するために歩道を進まなければならない配送ロボットなど、あらゆる種類の自律マシンの開発で使用されています。

GameGAN は、上記のようなタスクのためのシミュレーターを構築する作業を、ニューラルネットワークのトレーニングだけで済ませられるようになる日が訪れる可能性を示唆しています。

自動車に 1 台のカメラを設置するところを想像してください。そのカメラは、道路環境がどのようなものであるのか、あるいはハンドルの操作やアクセルの踏み込みなど、ドライバーがどのような行動をしているのかを、記録することができます。人間のドライバー、あるいは自律走行車が急ブレーキを踏むといったような行動をとれば、このデータを使って、現実世界で何が起こるのかを予測できるディープラーニング モデルのトレーニングを行えるようになるでしょう。

トロントにある NVIDIA AI Research ラボ のディレクター、サーニャ フィドラー (Sanja Fidler) は、次のように述べています。「最終的には、動画を見て、エージェントが環境でとる行動を知るだけで、運転のルール、物理法則を模倣することを学ぶ AI を生み出すことができるでしょう。GameGAN は、それに向けての第 1 歩なのです。」

NVIDIA Research は、全世界で 200 人以上のサイエンティストを擁しており、AI やコンピューター ビジョン、自動運転車、ロボティクス、グラフィックスといった分野を専門としています。

GameGAN は、フィドラー、キム、NVIDIA の研究者であるジョナ フィリオン (Jonah Philion)、トロント大学の学生である チョウ ユーハオ (Yuhao Zhou) および MIT のアントニオ トラルバ (Antonio Torralba) 教授が論文執筆者となっています。この論文は、6 月に権威ある Conference on Computer Vision and Pattern Recognition で発表されます。

PAC-MANTM & ©BANDAI NAMCO Entertainment Inc.