不完全データ、完全ダイナミクス:拡散アプローチ

不完全データ、完全ダイナミクス:拡散アプローチ

なぜ重要か: 企業や社会への影響が見込まれ、一般メディアにも波及する可能性があります。

ソースを読む(export.arxiv.org)

arXiv:2509.20098v1発表形式:新規

要約:データから物理ダイナミクスを学習することは、機械学習と科学的モデリングにおける根本的な課題である。現実世界の観測データは本質的に不完全かつ不規則にサンプリングされており、既存のデータ駆動型アプローチにとって大きな課題となっている。本研究では、不完全な訓練サンプルから物理システムを学習するための原理に基づいた拡散ベースのフレームワークを提案する。この目的のために、提案手法は、慎重に設計された分割戦略を用いて、そのようなサンプルをそれぞれ観測されたコンテキストと観測されていないクエリコンポーネントに戦略的に分割し、その後、利用可能なコンテキストを所与として欠損しているクエリ部分を再構成する条件付き拡散モデルを訓練する。この定式化により、完全なデータの監督を必要とせずに、任意の観測パターンにわたる正確な補完が可能となる。具体的には、不完全なデータに関する拡散訓練パラダイムが、緩やかな正則性条件下で真の完全な生成過程に漸近的に収束することを示す理論的分析を提供する。経験的には、流体流れや気象システムを含む、合成および現実世界の物理ダイナミクスベンチマークにおいて、既存のベースラインを大幅に上回る性能を示し、特に限られた不規則な観測体制において強い性能を示す。これらの結果は、部分的に観測されたダイナミクスを学習および補完するための、理論的に原理に基づいたアプローチの有効性を示している。

原文(英語)を表示

Title (EN): Incomplete Data, Complete Dynamics: A Diffusion Approach

arXiv:2509.20098v1 Announce Type: new
Abstract: Learning physical dynamics from data is a fundamental challenge in machine learning and scientific modeling. Real-world observational data are inherently incomplete and irregularly sampled, posing significant challenges for existing data-driven approaches. In this work, we propose a principled diffusion-based framework for learning physical systems from incomplete training samples. To this end, our method strategically partitions each such sample into observed context and unobserved query components through a carefully designed splitting strategy, then trains a conditional diffusion model to reconstruct the missing query portions given available contexts. This formulation enables accurate imputation across arbitrary observation patterns without requiring complete data supervision. Specifically, we provide theoretical analysis demonstrating that our diffusion training paradigm on incomplete data achieves asymptotic convergence to the true complete generative process under mild regularity conditions. Empirically, we show that our method significantly outperforms existing baselines on synthetic and real-world physical dynamics benchmarks, including fluid flows and weather systems, with particularly strong performance in limited and irregular observation regimes. These results demonstrate the effectiveness of our theoretically principled approach for learning and imputing partially observed dynamics.

Published: 2025-09-24 19:00 UTC


コメントする