拡散とフローベースのカップラ:依存関係の忘却と想起
なぜ重要か: 企業や社会への影響が見込まれ、一般メディアにも波及する可能性があります。
arXiv:2509.19707v1発表種別:cross
抄録:コピュラはデータにおける多変量依存関係をモデル化するための基本的なツールであり、多様な分野やアプリケーションで主要な手法となっている。しかし、既存モデルの多峰性および高次元依存関係への適用は、制約的な仮定とスケーリングの悪さによって妨げられている。本研究では、拡散とフローの原理に基づいたコピュラモデル化手法を提案する。次元ごとの分布に影響を与えずに、変数間の依存関係を段階的に忘却させる2つの過程を設計し、常に有効なコピュラを定義することを証明する。各過程から忘れられた依存関係を学習することにより、コピュラモデルを取得する方法を示し、最適化において真のコピュラを理論的に復元する。本フレームワークの最初の具体例は直接密度推定に焦点を当て、2つ目は迅速なサンプリングに特化している。実験的に、科学データセットと画像からの複雑で高次元の依存関係のモデル化において、提案手法が最先端のコピュラ手法よりも優れた性能を示すことを実証する。本研究はコピュラモデルの表現能力を高め、アプリケーションを強化し、より大規模かつより困難な分野での採用への道を拓く。
原文(英語)を表示
Title (EN): Diffusion and Flow-based Copulas: Forgetting and Remembering Dependencies
arXiv:2509.19707v1 Announce Type: cross
Abstract: Copulas are a fundamental tool for modelling multivariate dependencies in data, forming the method of choice in diverse fields and applications. However, the adoption of existing models for multimodal and high-dimensional dependencies is hindered by restrictive assumptions and poor scaling. In this work, we present methods for modelling copulas based on the principles of diffusions and flows. We design two processes that progressively forget inter-variable dependencies while leaving dimension-wise distributions unaffected, provably defining valid copulas at all times. We show how to obtain copula models by learning to remember the forgotten dependencies from each process, theoretically recovering the true copula at optimality. The first instantiation of our framework focuses on direct density estimation, while the second specialises in expedient sampling. Empirically, we demonstrate the superior performance of our proposed methods over state-of-the-art copula approaches in modelling complex and high-dimensional dependencies from scientific datasets and images. Our work enhances the representational power of copula models, empowering applications and paving the way for their adoption on larger scales and more challenging domains.
Published: 2025-09-24 19:00 UTC