DeepACTIF:ニューラルシーケンスモデルにおける活性化トレースによる効率的な特徴量帰属

DeepACTIF:ニューラルシーケンスモデルにおける活性化トレースによる効率的な特徴量帰属

なぜ重要か: 企業や社会への影響が見込まれ、一般メディアにも波及する可能性があります。

ソースを読む(export.arxiv.org)

arXiv:2509.19362v1発表タイプ:クロス

概要:深層学習モデル、特にヘルスケア、バイオメトリクス、人間とAIのインタラクションといった時系列領域における解釈には、特徴量帰属が不可欠です。しかし、Integrated GradientsやSHAPなどの標準的な帰属手法は計算コストが高く、リアルタイムアプリケーションには適していません。本研究では、シーケンスモデルの内部活性化を利用して効率的に特徴量の重要度を推定する、軽量かつアーキテクチャに配慮した特徴量帰属手法DeepACTIFを提案します。LSTMベースのネットワークに焦点を当て、時間ステップ全体での活性化の安定性と大きさを重視した逆加重集約スキームを導入します。3つのバイオメトリクス視線データセットを用いた評価によると、DeepACTIFは厳しい特徴量削減(上位10%の特徴量)下でも予測性能を維持するだけでなく、精度と統計的頑健性の両方において、SHAP、IG、DeepLIFTなどの既存手法を大幅に上回ります。Wilcoxon符号付順位検定と効果量分析を用いて、DeepACTIFはすべてのトップk条件(10~40%)において、有意に低い誤差でより有益な特徴量ランキングを提供することを示します。実験により、DeepACTIFは計算時間とメモリ使用量を桁違いに削減するだけでなく、上位の特徴量のみを使用した場合でもモデル精度を維持することが示されました。これは、モバイルXRヘッドセットや埋め込み型ヘルスモニターなどのエッジデバイスにおけるリアルタイム解釈のための現実的な解決策となります。

原文(英語)を表示

Title (EN): DeepACTIF: Efficient Feature Attribution via Activation Traces in Neural Sequence Models

arXiv:2509.19362v1 Announce Type: cross
Abstract: Feature attribution is essential for interpreting deep learning models, particularly in time-series domains such as healthcare, biometrics, and human-AI interaction. However, standard attribution methods, such as Integrated Gradients or SHAP, are computationally intensive and not well-suited for real-time applications. We present DeepACTIF, a lightweight and architecture-aware feature attribution method that leverages internal activations of sequence models to estimate feature importance efficiently. Focusing on LSTM-based networks, we introduce an inverse-weighted aggregation scheme that emphasises stability and magnitude of activations across time steps. Our evaluation across three biometric gaze datasets shows that DeepACTIF not only preserves predictive performance under severe feature reduction (top 10% of features) but also significantly outperforms established methods, including SHAP, IG, and DeepLIFT, in terms of both accuracy and statistical robustness. Using Wilcoxon signed-rank tests and effect size analysis, we demonstrate that DeepACTIF yields more informative feature rankings with significantly lower error across all top-k conditions (10 – 40%). Our experiments demonstrate that DeepACTIF not only reduces computation time and memory usage by orders of magnitude but also preserves model accuracy when using only top-ranked features. That makes DeepACTIF a viable solution for real-time interpretability on edge devices such as mobile XR headsets or embedded health monitors.

Published: 2025-09-24 19:00 UTC


コメントする