岐路に立つ: AI による交差点理解

投稿者: Neda Cvijetic

編注: これは「NVIDIA DRIVE ラボ」シリーズの最新のブログです。このシリーズでは、自動運転にまつわるさまざまな課題や、NVIDIA DRIVE AV ソフトウェア チームがそれらにどのように対処しているかについて、エンジニアの観点から迫ります。DRIVE ラボ シリーズの他のブログは、こちらをご覧ください。

交差点は、近所にある一時停止のある十字路でも、混み合った複数車線がある大通りの信号機だらけの往来でも、どこでもよく見られる道路の特徴です。

米国の重大事故の 50% 以上が交差点またはその付近で起こっており、その頻度、種類、リスクを考えると、自動運転車両が交差点を正確に通行できることは非常に重要です。

自動運転車両が交差点を自律的に扱うには、複雑な課題がいくつも出てきます。交差点の停止線や横断歩道で正確に止まったり、さまざまなシナリオで交通規則の優先通行権を正しく解釈したり、交差点を直進して通り抜けたり、信号のない交差点で右左折したり、多様な操縦に際して正しい進路を判断し実行する必要があります。

以前の DRIVE ラボ シリーズでは、WaitNet DNN による交差点、信号機、交通標識の検出をご紹介しました。また、LightNet と SignNet DNN による信号機の状態や交通標識の分類についても触れました。今回のブログではさらに、自動運転車両が日々のドライブで出会うと思われるさまざまな交差点構造のAIによる認識をご説明します。

手作業によるマップ作成

以前の手法では、交差点の構造を理解し、安全に走行できる進路を作成するために、交差点とその周辺一帯の高精細 3D セマンティック マップに頼っていました。

このようなマップの作成では、交差点の進入線/脱出線や分割線の位置、信号機や標識の配置、各方向の車線数など、潜在的に関連する交差点構造の特徴を手動でエンコードするため、人手によるラベリングが大量に行われます。交差点のシナリオが複雑になればなるほど、手動によるマップのアノテーションがますます大量に必要になるのです。

このアプローチの実用上の重大な限界は、拡張性に欠ける点です。自動運転で通れるように、世界中のあらゆる交差点を手動でラベリングする必要があるとしたら、そのためのデータ収集やラベリングはきわめて非現実的であり、費用的にも難しいでしょう。

もう 1 つの課題は、工事現場のような一時的な変化があることです。このようなシナリオは一時的なものであることから、それをマップに書き入れたり消したりするのはきわめて複雑な作業となりかねません。

それに対して、私たちのアプローチは人間の運転に似ています。人間は、交差点の構造を理解し交差点を走行するために、地図を頼るのではなく、その場でライブ認識を行います。

交差点に対する構造的アプローチ

私たちのアルゴリズムは、WaitNet DNN の機能を拡張して、交差点構造を点の集まりとして予測できるようにしたものです。これらの点は人体の関節に似ており、私たちは「関節 (joint)」と呼んでいます。このアプローチにおいて、交差点を通り抜ける自動運転車両の動きは、人間の手足の動きが関節同士のつながりによって実現しているのと同じように、交差点構造の関節を車両がたどる進路につなげることによって実現できるかもしれません。


図 1 は、DNN ベースの手法を使って交差点構造の予測をしているところを示しています。自車両や他車両における交差点への進入点と退出点、横断歩道の始点と終点など、交差点構造の特徴を検出し複数のクラスに分類しています。

図 1: 交差点構造の予測。赤 = 自車両の交差点進入停止線、黄 = 他の車両の交差点進入停止線、緑 = 交差点退出線。この図において、緑の線は、自車両が最も左の車線から交差点に進入した際に、交差点を退出できるすべての道を示します。自車両は、直進を続けるか、左折するか、U ターンすることができます。

画像の輪郭をセグメント化する代わりに、この DNN は、別の車線の交差点進入点および退出点を見分けることができます。このアプローチのもう 1 つの大きな利点は、交差点構造の予測はオクルージョン (遮蔽) や部分的なオクルージョンに対して堅牢であり、交差点構造の塗装された線も推定される線も両方予測できる点です。

また、図 1 の交差点の主な点を、交差点の走行のための進路につなげることもできるかもしれません。交差点の進入点と脱出点をつなげることによって、エゴ カーの動きを表す進路や軌道の予測が可能になります。

このライブ認識アプローチは、各交差点を個別に手動でラベリングするという負担なしに、さまざまな種類の交差点を扱えるという拡張性を実現します。また、高品質のマップ データを利用できる場合、マップ情報と組み合わせることによって、複雑な交差点に対処するための多様性と冗長性を実現できます。

この DNN ベースの交差点構造予測機能は、WaitNet DNN の 追加項目として、今後の DRIVE ソフトウェアのリリースで開発者に提供される予定です。DNN モデルについての詳細は、DRIVE Perception のページをご覧ください。