人工ニューラルネットワークにおけるフィッシャー情報流

人工ニューラルネットワークにおけるフィッシャー情報流

なぜ重要か: 企業や社会への影響が見込まれ、一般メディアにも波及する可能性があります。

ソースを読む(export.arxiv.org)

arXiv:2509.02407v2 発表種別:差し替え

要約:測定データからの連続パラメータ推定は、物理学の多くの分野において中心的な役割を果たす。このような推定プロセスの理解と改善における重要なツールはフィッシャー情報量的概念であり、これは未知のパラメータに関する情報が物理システムを通じてどのように伝播し、精度の上限を決定するかを定量化する。人工ニューラルネットワーク(ANNs)が多くの測定システムにおいて不可欠な部分になりつつあるため、それらが内部でパラメータ関連情報をどのように処理し伝達するのかを理解することが不可欠である。本稿では、パラメータ推定タスクを実行するANNを通じたフィッシャー情報量の流動を、入力層から出力層まで追跡する手法を示す。最適な推定性能はフィッシャー情報量の最大伝達に対応し、この点を越えて訓練すると過学習による情報損失が生じることを示す。これは、ネットワーク訓練のためのモデル非依存の停止基準を提供し、別途検証データセットを必要としない。本手法の実用的な関連性を示すために、画像実験のデータで訓練されたネットワークに適用し、現実的な物理的環境における有効性を強調する。

原文(英語)を表示

Title (EN): Fisher information flow in artificial neural networks

arXiv:2509.02407v2 Announce Type: replace
Abstract: The estimation of continuous parameters from measured data plays a central role in many fields of physics. A key tool in understanding and improving such estimation processes is the concept of Fisher information, which quantifies how information about unknown parameters propagates through a physical system and determines the ultimate limits of precision. With Artificial Neural Networks (ANNs) gradually becoming an integral part of many measurement systems, it is essential to understand how they process and transmit parameter-relevant information internally. Here, we present a method to monitor the flow of Fisher information through an ANN performing a parameter estimation task, tracking it from the input to the output layer. We show that optimal estimation performance corresponds to the maximal transmission of Fisher information, and that training beyond this point results in information loss due to overfitting. This provides a model-free stopping criterion for network training-eliminating the need for a separate validation dataset. To demonstrate the practical relevance of our approach, we apply it to a network trained on data from an imaging experiment, highlighting its effectiveness in a realistic physical setting.

Published: 2025-09-24 19:00 UTC


コメントする