差分プライバシーブートストラップ:新たなプライバシー分析と推論戦略
なぜ重要か: 企業や社会への影響が見込まれ、一般メディアにも波及する可能性があります。
arXiv:2210.06140v4 発表種別:差替クロス
要約:差分プライバシー(DP)機構は、統計分析手順にランダム性を与えることで、個人の情報を保護します。多数のDPツールが利用可能であるにもかかわらず、DP下での統計的推論を行うための一般的な手法は不足しています。本稿では、サンプリング分布を推定し、信頼区間(CI)を構築するために、複数のプライベートブートストラップ推定値を公開するDPブートストラップ手順を検討します。プライバシー分析では、任意のDP機構に適用可能な単一のDPブートストラップ推定値のプライバシーコストに関する新たな結果を示し、既存文献におけるブートストラップの誤用をいくつか特定します。DPブートストラップの合成については、複数のDPブートストラップ推定値を公開する際の正確なプライバシーコストを計算するための数値的方法を示し、Gaussian-DP(GDP)フレームワーク(Dong et al., 2022)を用いて、$(\mu/\sqrt{(2-2/\mathrm{e})B})$-GDPを満たす機構からの$B$個のDPブートストラップ推定値の公開は、$B$が無限大に近づくにつれて漸近的に$\mu$-GDPを満たすことを示します。次に、DPブートストラップ推定値を後処理することで、プライベートな統計的推論を実行します。我々の点推定値は一致性があり、標準CIは漸近的に有効であり、どちらも最適な収束速度を持つことを証明します。有限性能をさらに向上させるために、DPブートストラップ推定値を用いたデコンボリューションを使用して、サンプリング分布を正確に推定します。母平均推定、ロジスティック回帰、分位点回帰などのタスクについてCIを導出し、2016年カナダ国勢調査データを用いたシミュレーションと現実世界の実験で既存の方法と比較します。我々のプライベートCIは名目上のカバレッジレベルを達成し、分位点回帰に対するプライベート推論への最初の取り組みを提供します。
原文(英語)を表示
Title (EN): Differentially Private Bootstrap: New Privacy Analysis and Inference Strategies
arXiv:2210.06140v4 Announce Type: replace-cross
Abstract: Differentially private (DP) mechanisms protect individual-level information by introducing randomness into the statistical analysis procedure. Despite the availability of numerous DP tools, there remains a lack of general techniques for conducting statistical inference under DP. We examine a DP bootstrap procedure that releases multiple private bootstrap estimates to infer the sampling distribution and construct confidence intervals (CIs). Our privacy analysis presents new results on the privacy cost of a single DP bootstrap estimate, applicable to any DP mechanism, and identifies some misapplications of the bootstrap in the existing literature. For the composition of the DP bootstrap, we present a numerical method to compute the exact privacy cost of releasing multiple DP bootstrap estimates, and using the Gaussian-DP (GDP) framework (Dong et al., 2022), we show that the release of $B$ DP bootstrap estimates from mechanisms satisfying $(\mu/\sqrt{(2-2/\mathrm{e})B})$-GDP asymptotically satisfies $\mu$-GDP as $B$ goes to infinity. Then, we perform private statistical inference by post-processing the DP bootstrap estimates. We prove that our point estimates are consistent, our standard CIs are asymptotically valid, and both enjoy optimal convergence rates. To further improve the finite performance, we use deconvolution with DP bootstrap estimates to accurately infer the sampling distribution. We derive CIs for tasks such as population mean estimation, logistic regression, and quantile regression, and we compare them to existing methods using simulations and real-world experiments on 2016 Canada Census data. Our private CIs achieve the nominal coverage level and offer the first approach to private inference for quantile regression.
Published: 2025-09-24 19:00 UTC