RoadMind:災害対応のための地理空間AI専門家を目指して
なぜ重要か: 企業や社会への影響が見込まれ、一般メディアにも波及する可能性があります。
arXiv:2509.19354v1発表形式:クロス
概要:大規模言語モデル(LLM)は様々な自然言語処理タスクにおいて目覚ましい性能を示しているものの、地理空間データ、特に道路網、距離、方向に関する推論能力は依然として限定的です。このギャップは、避難計画や資源配分など空間理解が不可欠な災害時において課題となっています。本研究では、OpenStreetMap(OSM)の構造化データを用いてLLMの地理空間推論能力を向上させる自己教師ありフレームワーク、RoadMindを提案します。本自動化パイプラインは、特定都市の道路インフラデータを抽出し、主要な空間タスクに合わせて調整された複数の教師データ形式に変換します。QLoRAアダプターと4ビット量子化モデルを用いて、これらの表現を用いてLLMを事前学習および微調整します。グローバルな表現が異なる3つの災害多発都市、ロサンゼルス、クライストチャーチ、マニラにおいて、道路区間の特定、最寄りの道路検索、距離/方向推定などのタスクについて、本手法を評価します。その結果、RoadMindによって訓練されたモデルは、高度なプロンプトエンジニアリングを備えた最先端のLLMを含む強力なベースラインを大幅に上回ることが示されました。これは、構造化された地理空間データが、災害対応のためのより効果的なオフラインAIシステムを実現する堅牢な空間推論能力を持つ言語モデルを強化する可能性を示しています。
原文(英語)を表示
Title (EN): RoadMind: Towards a Geospatial AI Expert for Disaster Response
arXiv:2509.19354v1 Announce Type: cross
Abstract: Large Language Models (LLMs) have shown impressive performance across a range of natural language tasks, but remain limited in their ability to reason about geospatial data, particularly road networks, distances, and directions. This gap poses challenges in disaster scenarios, where spatial understanding is critical for tasks such as evacuation planning and resource allocation. In this work, we present RoadMind, a self-supervised framework that enhances the geospatial reasoning capabilities of LLMs using structured data from OpenStreetMap (OSM). Our automated pipeline extracts road infrastructure data for a given city and converts it into multiple supervision formats tailored to key spatial tasks. We pretrain and fine-tune LLMs on these representations using QLoRA adapters and 4-bit quantized models. We evaluate our approach on three disaster-prone cities with varying global representation, Los Angeles, Christchurch, and Manila, across tasks such as road segment identification, nearest road retrieval, and distance/direction estimation. Our results show that models trained via RoadMind significantly outperform strong baselines, including state-of-the-art LLMs equipped with advanced prompt engineering. This demonstrates the potential of structured geospatial data to enhance language models with robust spatial reasoning, enabling more effective offline AI systems for disaster response.
Published: 2025-09-24 19:00 UTC