相関障害物場における確率的経路計画
なぜ重要か: 企業や社会への影響が見込まれ、一般メディアにも波及する可能性があります。
arXiv:2509.19559v1発表形式:クロス
要旨:本稿では、不確実な閉塞状態の空間的に相関する障害物、ノイズの多い読み取り値を提供する現実的に制約されたセンサー、および高価な曖昧性解消を伴うナビゲーション設定である確率的相関障害物シーン(SCOS)問題を紹介する。ガウス型ランダム場(GRF)を用いて空間的相関をモデル化し、閉塞確率を洗練するベイズ信念更新を開発し、事後確率を使用して効率的に探索空間を削減する。最適な横断ポリシーを見つけるために、新規な2段階学習フレームワークを提案する。オフラインフェーズでは、情報ボーナスを付加した楽観的ポリシー反復を用いてロバストな基本ポリシーを学習し、情報量の多い領域の探査を促進する。その後、ベイズ機構による情報適応を用いて定期的に基本ポリシーを更新するオンライン展開ポリシーを行う。このフレームワークは、モンテカルロ点推定と分布強化学習(RL)の両方を利用して完全なコスト分布を学習し、より強力な不確実性定量化を実現する。相関認識更新と事後サンプリング下での収束特性の理論的利点を確立する。様々な障害物密度、センサー能力における包括的な経験的評価により、ベースラインに対する一貫した性能向上を示す。このフレームワークは、敵対的な中断や集中した自然災害のある環境におけるナビゲーション課題に対処する。
原文(英語)を表示
Title (EN): Stochastic Path Planning in Correlated Obstacle Fields
arXiv:2509.19559v1 Announce Type: cross
Abstract: We introduce the Stochastic Correlated Obstacle Scene (SCOS) problem, a navigation setting with spatially correlated obstacles of uncertain blockage status, realistically constrained sensors that provide noisy readings and costly disambiguation. Modeling the spatial correlation with Gaussian Random Field (GRF), we develop Bayesian belief updates that refine blockage probabilities, and use the posteriors to reduce search space for efficiency. To find the optimal traversal policy, we propose a novel two-stage learning framework. An offline phase learns a robust base policy via optimistic policy iteration augmented with information bonus to encourage exploration in informative regions, followed by an online rollout policy with periodic base updates via a Bayesian mechanism for information adaptation. This framework supports both Monte Carlo point estimation and distributional reinforcement learning (RL) to learn full cost distributions, leading to stronger uncertainty quantification. We establish theoretical benefits of correlation-aware updating and convergence property under posterior sampling. Comprehensive empirical evaluations across varying obstacle densities, sensor capabilities demonstrate consistent performance gains over baselines. This framework addresses navigation challenges in environments with adversarial interruptions or clustered natural hazards.
Published: 2025-09-24 19:00 UTC