周囲車両の模倣による運転学習

周囲車両の模倣による運転学習

なぜ重要か: 企業や社会への影響が見込まれ、一般メディアにも波及する可能性があります。

ソースを読む(export.arxiv.org)

arXiv:2503.05997v2発表種別:置換クロス

概要:模倣学習は、熟練運転者の行動を模倣することで、自律走行車(AV)が複雑な交通環境を走行するための有望なアプローチです。既存の模倣学習フレームワークは熟練運転者のデモンストレーションを活用することに重点を置いていますが、周囲の交通参加者からの追加の複雑な運転データの可能性を見過ごしていることが多々あります。本論文では、AVのセンサーで取得された近隣の車両の観測された軌跡を追加のデモンストレーションとして活用するデータ拡張戦略を研究します。情報量が多く多様な運転行動を優先する、単純な車両選択サンプリングとフィルタリング戦略を導入し、トレーニングのためのより豊富なデータセットに貢献します。このアイデアを代表的な学習ベースのプランナーで、大規模な現実世界のデータセットを用いて評価し、複雑な運転シナリオにおける性能向上を示します。具体的には、このアプローチは衝突率を削減し、ベースラインと比較して安全指標を向上させます。特に、元のデータセットのわずか10%しか使用しない場合でも、この手法はフルデータセットの性能に匹敵するか、それを上回ります。アブレーションを通して、選択基準を分析し、ナイーブなランダム選択は性能を低下させる可能性があることを示します。私たちの知見は、模倣学習における多様な現実世界の軌跡データの活用価値を強調し、自律運転のためのデータ拡張戦略に関する洞察を提供します。

原文(英語)を表示

Title (EN): Learning to Drive by Imitating Surrounding Vehicles

arXiv:2503.05997v2 Announce Type: replace-cross
Abstract: Imitation learning is a promising approach for training autonomous vehicles (AV) to navigate complex traffic environments by mimicking expert driver behaviors. While existing imitation learning frameworks focus on leveraging expert demonstrations, they often overlook the potential of additional complex driving data from surrounding traffic participants. In this paper, we study a data augmentation strategy that leverages the observed trajectories of nearby vehicles, captured by the AV’s sensors, as additional demonstrations. We introduce a simple vehicle-selection sampling and filtering strategy that prioritizes informative and diverse driving behaviors, contributing to a richer dataset for training. We evaluate this idea with a representative learning-based planner on a large real-world dataset and demonstrate improved performance in complex driving scenarios. Specifically, the approach reduces collision rates and improves safety metrics compared to the baseline. Notably, even when using only 10 percent of the original dataset, the method matches or exceeds the performance of the full dataset. Through ablations, we analyze selection criteria and show that naive random selection can degrade performance. Our findings highlight the value of leveraging diverse real-world trajectory data in imitation learning and provide insights into data augmentation strategies for autonomous driving.

Published: 2025-09-24 19:00 UTC


コメントする