深層生成モデルを用いた多様な大気超解像技術

深層生成モデルを用いた多様な大気超解像技術

なぜ重要か: 企業や社会への影響が見込まれ、一般メディアにも波及する可能性があります。

ソースを読む(export.arxiv.org)

arXiv:2506.22780v2発表タイプ:差し替え

要約:スコアベース拡散モデルは、複雑な分布からサンプリングできる生成機械学習アルゴリズムです。これは、スコア関数、つまりデータの対数確率密度関数の勾配を学習し、それを使用してノイズ除去プロセスを逆転させることで実現されます。一度学習されると、スコアベース拡散モデルは新しいサンプルを生成するだけでなく、観測データに対するゼロショット条件付けも可能になります。これは、事前学習されたスコアベース拡散モデルの暗黙的に学習された分布を、ベイズ的定式化においてオンラインデータの可用性に基づいて更新できる、データとモデルの融合のための新しいパラダイムを約束します。本稿では、この概念を高次元動的システムの超解像度問題に適用し、低解像度の実験的に観測されたマルチモーダルデータからのスパースセンサ測定値がリアルタイムで利用可能である場合の超解像度を実現します。スコアベースサンプリングを不確実性推定にどのように使用できるかについての追加分析も行います。実験は、粗粒化された表現からのスパース観測と/またはIGRAラジオゾンデデータの非構造化実験観測からERA5大気データセットを生成する超解像度タスクに対して行われます。低忠実度測定値の複数のソースを考慮して、高次元状態の正確な復元を実証します。また、生成モデルは、時空間再構成中に複数のデータセットモダリティの影響をバランスさせることができることも発見しました。

原文(英語)を表示

Title (EN): Multimodal Atmospheric Super-Resolution With Deep Generative Models

arXiv:2506.22780v2 Announce Type: replace
Abstract: Score-based diffusion modeling is a generative machine learning algorithm that can be used to sample from complex distributions. They achieve this by learning a score function, i.e., the gradient of the log-probability density of the data, and reversing a noising process using the same. Once trained, score-based diffusion models not only generate new samples but also enable zero-shot conditioning of the generated samples on observed data. This promises a novel paradigm for data and model fusion, wherein the implicitly learned distributions of pretrained score-based diffusion models can be updated given the availability of online data in a Bayesian formulation. In this article, we apply such a concept to the super-resolution of a high-dimensional dynamical system, given the real-time availability of low-resolution and experimentally observed sparse sensor measurements from multimodal data. Additional analysis on how score-based sampling can be used for uncertainty estimates is also provided. Our experiments are performed for a super-resolution task that generates the ERA5 atmospheric dataset given sparse observations from a coarse-grained representation of the same and/or from unstructured experimental observations of the IGRA radiosonde dataset. We demonstrate accurate recovery of the high dimensional state given multiple sources of low-fidelity measurements. We also discover that the generative model can balance the influence of multiple dataset modalities during spatiotemporal reconstructions.

Published: 2025-09-24 19:00 UTC


コメントする