RDAR:自律運転のための報酬駆動型エージェント関連性推定

RDAR:自律運転のための報酬駆動型エージェント関連性推定

なぜ重要か: 企業や社会への影響が見込まれ、一般メディアにも波及する可能性があります。

ソースを読む(export.arxiv.org)

arXiv:2509.19789v1発表タイプ:クロス

要旨:人間の運転手は、一度に少数のエージェントのみに注目する。一方、自動運転システムは、横断歩道の歩行者であろうと路肩に駐車している車両であろうと、多数のエージェントを含む複雑なシーンを処理する。アテンションメカニズムは意思決定に影響を与える要素への入力の削減を暗黙的に行う方法を提供するが、エージェント間の相互作用を捉える既存のアテンションメカニズムは2次式であり、一般的に計算コストが高い。本稿では、事前学習済み行動モデルへの入力から除外できるエージェントを特定することにより、各エージェントの関連性(各エージェントが制御車両の挙動にどの程度影響するか)を学習する戦略であるRDARを提案する。マスク手順を、行動がエージェント選択を示すバイナリマスクからなるマルコフ決定過程として定式化する。大規模な運転データセットでRDARを評価し、最先端の行動モデルと比較して大幅に少ないエージェントを処理しながら、全体的な進捗、安全性、性能という点で同等の運転性能を達成することにより、関連性の正確な数値尺度を学習できることを実証する。

原文(英語)を表示

Title (EN): RDAR: Reward-Driven Agent Relevance Estimation for Autonomous Driving

arXiv:2509.19789v1 Announce Type: cross
Abstract: Human drivers focus only on a handful of agents at any one time. On the other hand, autonomous driving systems process complex scenes with numerous agents, regardless of whether they are pedestrians on a crosswalk or vehicles parked on the side of the road. While attention mechanisms offer an implicit way to reduce the input to the elements that affect decisions, existing attention mechanisms for capturing agent interactions are quadratic, and generally computationally expensive. We propose RDAR, a strategy to learn per-agent relevance — how much each agent influences the behavior of the controlled vehicle — by identifying which agents can be excluded from the input to a pre-trained behavior model. We formulate the masking procedure as a Markov Decision Process where the action consists of a binary mask indicating agent selection. We evaluate RDAR on a large-scale driving dataset, and demonstrate its ability to learn an accurate numerical measure of relevance by achieving comparable driving performance, in terms of overall progress, safety and performance, while processing significantly fewer agents compared to a state of the art behavior model.

Published: 2025-09-24 19:00 UTC


コメントする