対称正定値行列の多様体上の包絡ガウス分布

対称正定値行列の多様体上の包絡ガウス分布

なぜ重要か: 企業や社会への影響が見込まれ、一般メディアにも波及する可能性があります。

ソースを読む(export.arxiv.org)

arXiv:2502.01512v4 発表種別:置換クロス

概要:円形および非平坦なデータ分布は、データサイエンスの様々な分野で広く見られるにもかかわらず、その固有の幾何学的構造は機械学習フレームワークにおいて十分に活用されていません。特に、遍在するガウス分布のような統計モデルを拡張する場合、このようなデータの基礎となる幾何形状を考慮するための原理に基づいたアプローチが不可欠です。本研究では、情報幾何学における重要な焦点である、対称正定値(SPD)行列の多様体に焦点を当てることで、これらの問題に取り組みます。指数写像を活用することにより非等方性包絡ガウス分布を導入し、この分布の理論的性質を導出し、パラメータ推定のための最尤推定枠組みを提案します。さらに、SPD上の確立された分類器を確率的なレンズを通して再解釈し、包絡ガウスモデルに基づく新しい分類器を導入します。合成データセットと実世界データセットに関する実験により、この幾何形状を考慮した分布の堅牢性と柔軟性が実証され、多様体ベースのデータ分析を進歩させる可能性が強調されます。本研究は、古典的な機械学習および統計的手法をより複雑で構造化されたデータに拡張するための基盤を築きます。

原文(英語)を表示

Title (EN): Wrapped Gaussian on the manifold of Symmetric Positive Definite Matrices

arXiv:2502.01512v4 Announce Type: replace-cross
Abstract: Circular and non-flat data distributions are prevalent across diverse domains of data science, yet their specific geometric structures often remain underutilized in machine learning frameworks. A principled approach to accounting for the underlying geometry of such data is pivotal, particularly when extending statistical models, like the pervasive Gaussian distribution. In this work, we tackle those issue by focusing on the manifold of symmetric positive definite (SPD) matrices, a key focus in information geometry. We introduce a non-isotropic wrapped Gaussian by leveraging the exponential map, we derive theoretical properties of this distribution and propose a maximum likelihood framework for parameter estimation. Furthermore, we reinterpret established classifiers on SPD through a probabilistic lens and introduce new classifiers based on the wrapped Gaussian model. Experiments on synthetic and real-world datasets demonstrate the robustness and flexibility of this geometry-aware distribution, underscoring its potential to advance manifold-based data analysis. This work lays the groundwork for extending classical machine learning and statistical methods to more complex and structured data.

Published: 2025-09-24 19:00 UTC


コメントする