ディリクレ過程混合を用いたDINO埋め込みのクラスタリングによる異常検知
なぜ重要か: 企業や社会への影響が見込まれ、一般メディアにも波及する可能性があります。
arXiv:2509.19997v1発表形式:クロス
概要:本研究では、医療画像における教師なし異常検知のために、基礎モデルからの情報豊富な埋め込みを活用する。小規模データセットでは、最近示されたように、規範的特徴のメモリバンクを直接異常検知に使用できる。しかし、これは計算負荷が大幅に増加するため、大規模医療データセットには不向きである。そこで、規範的なDINOv2埋め込みの分布を、データに合わせて混合成分数を自動的に調整するノンパラメトリック混合モデルであるディリクレ過程混合モデル(DPMM)でモデル化することを提案する。メモリバンクを使用する代わりに、成分中心と埋め込みの類似度を異常スコア関数として使用し、粗い異常セグメンテーションマスクを作成する。実験の結果、自然画像で学習されたDINOv2のDPMM埋め込みは、医療画像ベンチマークにおいて非常に競争力のある異常検知性能を達成し、推論時の計算時間を少なくとも半分に削減できることが示された。さらに、分析によると、正規化されたDINOv2埋め込みは、異常が存在する場合でも、一般的に非正規化された特徴よりも解剖学的構造とよく整合しており、異常検知のための優れた表現となっている。コードはhttps://github.com/NicoSchulthess/anomalydino-dpmmで公開している。
原文(英語)を表示
Title (EN): Anomaly Detection by Clustering DINO Embeddings using a Dirichlet Process Mixture
arXiv:2509.19997v1 Announce Type: cross
Abstract: In this work, we leverage informative embeddings from foundational models for unsupervised anomaly detection in medical imaging. For small datasets, a memory-bank of normative features can directly be used for anomaly detection which has been demonstrated recently. However, this is unsuitable for large medical datasets as the computational burden increases substantially. Therefore, we propose to model the distribution of normative DINOv2 embeddings with a Dirichlet Process Mixture model (DPMM), a non-parametric mixture model that automatically adjusts the number of mixture components to the data at hand. Rather than using a memory bank, we use the similarity between the component centers and the embeddings as anomaly score function to create a coarse anomaly segmentation mask. Our experiments show that through DPMM embeddings of DINOv2, despite being trained on natural images, achieve very competitive anomaly detection performance on medical imaging benchmarks and can do this while at least halving the computation time at inference. Our analysis further indicates that normalized DINOv2 embeddings are generally more aligned with anatomical structures than unnormalized features, even in the presence of anomalies, making them great representations for anomaly detection. The code is available at https://github.com/NicoSchulthess/anomalydino-dpmm.
Published: 2025-09-24 19:00 UTC