堅牢な時系列分類のためのシンボル時間的整合性自己教師あり学習
なぜ重要か: 企業や社会への影響が見込まれ、一般メディアにも波及する可能性があります。
arXiv:2509.19654v1 発表種別:新規
概要:デジタルヘルス分野における時系列データの重要性の高まりを受け、意味のあるパターンと表現を抽出するための高度な方法論が必要とされている。自己教師ありコントラスティブ学習は、生データから直接学習するための有望なアプローチとして台頭している。しかし、デジタルヘルスの時系列データは非常にノイズが多く、本質的に概念ドリフトを含み、汎化可能な深層学習モデルの訓練を困難にすることが知られている。本論文では、異なる人間の行動によって引き起こされるデータ分布シフトに特化し、記号の袋表現を意識した自己教師あり学習フレームワークを提案する。記号の袋表現は、時系列データに存在するデータ歪み、位置ずれ、ノイズに影響を受けにくいことで知られており、深層学習がこのようなデータシフトに耐性のある表現を獲得する上で重要な役割を果たす可能性がある。提案手法は、有意なデータシフトが存在する場合に、著しく優れた性能を達成できることを示す。
原文(英語)を表示
Title (EN): Symbol-Temporal Consistency Self-supervised Learning for Robust Time Series Classification
arXiv:2509.19654v1 Announce Type: new
Abstract: The surge in the significance of time series in digital health domains necessitates advanced methodologies for extracting meaningful patterns and representations. Self-supervised contrastive learning has emerged as a promising approach for learning directly from raw data. However, time series data in digital health is known to be highly noisy, inherently involves concept drifting, and poses a challenge for training a generalizable deep learning model. In this paper, we specifically focus on data distribution shift caused by different human behaviors and propose a self-supervised learning framework that is aware of the bag-of-symbol representation. The bag-of-symbol representation is known for its insensitivity to data warping, location shifts, and noise existed in time series data, making it potentially pivotal in guiding deep learning to acquire a representation resistant to such data shifting. We demonstrate that the proposed method can achieve significantly better performance where significant data shifting exists.
Published: 2025-09-24 19:00 UTC