MAME:多次元適応メタマー探査と人間の知覚フィードバック
なぜ重要か: 企業や社会への影響が見込まれ、一般メディアにも波及する可能性があります。
arXiv:2503.13212v2 掲載種別:差し替え
要旨:人間の脳ネットワークと人工モデルの整合性は、視覚科学と機械学習において活発な研究分野となっている。「メタマー」、すなわち物理的には異なるがシステム内では知覚的に等価な刺激を特定することが広く採用されている手法である。しかし、従来の手法では人間のメタマー空間を直接探索するアプローチが不足している。研究者はまず生物学的に着想を得たモデルを開発し、モデルのメタマーが人間にとってもメタマーとして現れるかどうかをテストすることで、間接的に人間のメタマーについて推論する。本稿では、人間の知覚的フィードバックによって導かれるオンライン画像生成を通じて、人間のメタマー空間の高次元探索を直接的に可能にする多次元適応メタマー探査(MAME)フレームワークを提案する。MAMEは、階層型ニューラルネットワークの応答に基づいて複数の次元で参照画像を調整し、参加者の知覚弁別能に応じて生成パラメータを適応的に更新する。MAMEを用いて、単一の心理物理実験において多次元の人間のメタマー空間を測定することに成功した。生物学的に妥当なCNNモデルを用いた実験結果では、低レベル特徴に基づくメタマー画像の方が高レベル特徴に基づくメタマー画像よりも人間の弁別感度が低いことが示され、これは画像コントラスト指標では説明できなかった。この知見は、高レベル処理と比較して、低レベル処理における人間とCNNモデルのメタマー空間の整合性が比較的悪いことを示唆している。高レベル表現レベルでの整合性に関する最近の議論を考えると直感に反するが、私たちの結果は、生物学的に妥当なモデルを形作る上で初期視覚計算の重要性を強調している。私たちのMAMEフレームワークは、人間の視覚の機能的組織を直接的に調査するための将来的な科学的ツールとして役立つ可能性がある。
原文(英語)を表示
Title (EN): MAME: Multidimensional Adaptive Metamer Exploration with Human Perceptual Feedback
arXiv:2503.13212v2 Announce Type: replace
Abstract: Alignment between human brain networks and artificial models has become an active research area in vision science and machine learning. A widely adopted approach is identifying “metamers,” stimuli physically different yet perceptually equivalent within a system. However, conventional methods lack a direct approach to searching for the human metameric space. Instead, researchers first develop biologically inspired models and then infer about human metamers indirectly by testing whether model metamers also appear as metamers to humans. Here, we propose the Multidimensional Adaptive Metamer Exploration (MAME) framework, enabling direct, high-dimensional exploration of human metameric spaces through online image generation guided by human perceptual feedback. MAME modulates reference images across multiple dimensions based on hierarchical neural network responses, adaptively updating generation parameters according to participants’ perceptual discriminability. Using MAME, we successfully measured multidimensional human metameric spaces within a single psychophysical experiment. Experimental results using a biologically plausible CNN model showed that human discrimination sensitivity was lower for metameric images based on low-level features compared to high-level features, which image contrast metrics could not explain. The finding suggests a relatively worse alignment between the metameric spaces of humans and the CNN model for low-level processing compared to high-level processing. Counterintuitively, given recent discussions on alignment at higher representational levels, our results highlight the importance of early visual computations in shaping biologically plausible models. Our MAME framework can serve as a future scientific tool for directly investigating the functional organization of human vision.
Published: 2025-09-24 19:00 UTC