監査分析における教師なし異常値検知:米国支出データを用いたケーススタディ
なぜ重要か: 企業や社会への影響が見込まれ、一般メディアにも波及する可能性があります。
arXiv:2509.19366v1発表形式:クロス
要旨:本研究は、米国保健福祉省(DHHS)の米国支出データを実例として用い、監査分析における教師なし異常検知手法の有効性を調査する。連邦支出パターンにおける異常を特定するため、ヒストグラムベースの異常スコア(HBOS)、頑健主成分分析(PCA)、最小共分散行列決定(MCD)、K近傍法(KNN)など、複数の異常検知アルゴリズムを用いて比較を行う。本研究は、従来の監査手法では不十分となる可能性のある大規模政府データセットにおける効率的で正確な異常検知の増大するニーズに対応する。本手法は、データ準備、アルゴリズム実装、精度、再現率、F1スコアを用いた性能評価を含む。結果は、複数の検知戦略を組み合わせたハイブリッドアプローチが、複雑な財務データにおける異常特定の堅牢性と精度を高めることを示している。本研究は、様々な異常検知モデルの比較有効性に関する知見を提供し、監査の質と効率の向上における教師なし学習技術の可能性を実証することにより、監査分析分野に貢献する。その知見は、政府の財政監視とリスク管理において高度な分析を活用しようとする監査官、政策立案者、研究者にとって示唆に富むものである。
原文(英語)を表示
Title (EN): Unsupervised Outlier Detection in Audit Analytics: A Case Study Using USA Spending Data
arXiv:2509.19366v1 Announce Type: cross
Abstract: This study investigates the effectiveness of unsupervised outlier detection methods in audit analytics, utilizing USA spending data from the U.S. Department of Health and Human Services (DHHS) as a case example. We employ and compare multiple outlier detection algorithms, including Histogram-based Outlier Score (HBOS), Robust Principal Component Analysis (PCA), Minimum Covariance Determinant (MCD), and K-Nearest Neighbors (KNN) to identify anomalies in federal spending patterns. The research addresses the growing need for efficient and accurate anomaly detection in large-scale governmental datasets, where traditional auditing methods may fall short. Our methodology involves data preparation, algorithm implementation, and performance evaluation using precision, recall, and F1 scores. Results indicate that a hybrid approach, combining multiple detection strategies, enhances the robustness and accuracy of outlier identification in complex financial data. This study contributes to the field of audit analytics by providing insights into the comparative effectiveness of various outlier detection models and demonstrating the potential of unsupervised learning techniques in improving audit quality and efficiency. The findings have implications for auditors, policymakers, and researchers seeking to leverage advanced analytics in governmental financial oversight and risk management.
Published: 2025-09-24 19:00 UTC