深層学習を用いたオフロード環境における自律走行車のビジョンベース知覚
なぜ重要か: 企業や社会への影響が見込まれ、一般メディアにも波及する可能性があります。
arXiv:2509.19378v1発表タイプ:クロス
要旨:不均一な地形を持つ露天掘り鉱山や発展途上国における自律走行には、低遅延のインテリジェントシステムが求められる。本研究は、事前に定義された経路なしに荒れた地形を走行可能な、未舗装道路およびオフロード環境における自律走行車両のための知覚システムを提案する。構成可能なモジュール型セグメンテーションネットワーク(CMSNet)フレームワークを提案し、異なるアーキテクチャ構成を容易にする。CMSNet構成は、悪条件(夜間、雨天、粉塵)下における未舗装道路/オフロードシナリオからの新規画像を用いて、障害物と走行可能な地面をセグメント化するよう訓練された。明示的な軌跡境界なしに走行可能な領域を検出するための深層学習の適用、視認性障害下におけるアルゴリズムの挙動、リアルタイムセマンティックセグメンテーションを用いた現地試験を調査した。8台の同期カメラを搭載した稼働車両から得られた約12,000枚の画像を含む新しいデータセット、Kaminoを発表する。Kaminoデータセットは、同様の公開コレクションと比較して、ラベル付けされたピクセル数が多く、悪視界下にある鉱山を模倣したオフロード試験場からの画像を含む。リアルタイム推論を実現するために、CMSNetのCNN層を体系的に削除し、TensorRT、C++、CUDAを用いて融合した。2つのデータセットを用いた実験により、提案システムの有効性が検証された。
原文(英語)を表示
Title (EN): Vision-Based Perception for Autonomous Vehicles in Off-Road Environment Using Deep Learning
arXiv:2509.19378v1 Announce Type: cross
Abstract: Low-latency intelligent systems are required for autonomous driving on non-uniform terrain in open-pit mines and developing countries. This work proposes a perception system for autonomous vehicles on unpaved roads and off-road environments, capable of navigating rough terrain without a predefined trail. The Configurable Modular Segmentation Network (CMSNet) framework is proposed, facilitating different architectural arrangements. CMSNet configurations were trained to segment obstacles and trafficable ground on new images from unpaved/off-road scenarios with adverse conditions (night, rain, dust). We investigated applying deep learning to detect drivable regions without explicit track boundaries, studied algorithm behavior under visibility impairment, and evaluated field tests with real-time semantic segmentation. A new dataset, Kamino, is presented with almost 12,000 images from an operating vehicle with eight synchronized cameras. The Kamino dataset has a high number of labeled pixels compared to similar public collections and includes images from an off-road proving ground emulating a mine under adverse visibility. To achieve real-time inference, CMSNet CNN layers were methodically removed and fused using TensorRT, C++, and CUDA. Empirical experiments on two datasets validated the proposed system’s effectiveness.
Published: 2025-09-24 19:00 UTC