多変量地下構造生成と効率的確率的逆問題解法のための拡散モデル
なぜ重要か: 企業や社会への影響が見込まれ、一般メディアにも波及する可能性があります。
arXiv:2507.15809v2 発表種別:差し替え
要旨:拡散モデルは、深層生成モデルタスクにおいて安定した学習と最先端の性能を提供する。本研究では、これを多変量地下構造モデリングと確率的インバージョンに応用することを検討する。まず、拡散モデルは変分オートエンコーダや敵対的生成ネットワークと比較して、多変量モデリング能力を向上させることを示す。拡散モデリングにおける生成過程は、比較的多数のステップを含み、更新規則は条件付けデータに対応するように修正できる。Chung et al. (2023)によるDiffusion Posterior Samplingアプローチに対する様々な修正を提案する。特に、拡散モデリングに固有のノイズ混入を考慮した尤度近似を導入する。堆積相と相関のある音響インピーダンスを含む多変量地質シナリオにおいて性能を評価する。条件付きモデリングは、局所的なハードデータ(井戸ログ)と非線形地球物理学データ(フルスタック地震データ)の両方を使用して実証する。テストの結果、元の方法と比較して、統計的堅牢性の向上、事後確率密度関数のサンプリングの強化、計算コストの削減が大幅に示された。この方法は、ハードデータと間接的な条件付けデータの両方に対して、個別にまたは同時に使用できる。インバージョンが拡散過程に含まれるため、マルコフ連鎖モンテカルロなど、生成モデルの外部ループを必要とする他の方法よりも高速である。
原文(英語)を表示
Title (EN): Diffusion models for multivariate subsurface generation and efficient probabilistic inversion
arXiv:2507.15809v2 Announce Type: replace-cross
Abstract: Diffusion models offer stable training and state-of-the-art performance for deep generative modeling tasks. Here, we consider their use in the context of multivariate subsurface modeling and probabilistic inversion. We first demonstrate that diffusion models enhance multivariate modeling capabilities compared to variational autoencoders and generative adversarial networks. In diffusion modeling, the generative process involves a comparatively large number of time steps with update rules that can be modified to account for conditioning data. We propose different corrections to the popular Diffusion Posterior Sampling approach by Chung et al. (2023). In particular, we introduce a likelihood approximation accounting for the noise-contamination that is inherent in diffusion modeling. We assess performance in a multivariate geological scenario involving facies and correlated acoustic impedance. Conditional modeling is demonstrated using both local hard data (well logs) and nonlinear geophysics (fullstack seismic data). Our tests show significantly improved statistical robustness, enhanced sampling of the posterior probability density function and reduced computational costs, compared to the original approach. The method can be used with both hard and indirect conditioning data, individually or simultaneously. As the inversion is included within the diffusion process, it is faster than other methods requiring an outer-loop around the generative model, such as Markov chain Monte Carlo.
Published: 2025-09-24 19:00 UTC