双対証明書による効率的なオンライン大域マージンクラス分類

双対証明書による効率的なオンライン大域マージンクラス分類

なぜ重要か: 企業や社会への影響が見込まれ、一般メディアにも波及する可能性があります。

ソースを読む(export.arxiv.org)

arXiv:2509.19670v1発表種別:クロス

概要:オンライン分類は、最適化、統計的学習、データサイエンスの中心的な問題である。パーセプトロンなどの古典的アルゴリズムは、線形分離可能なデータに対して効率的な更新と有限の誤り保証を提供するが、分類問題の基礎となる幾何学的構造を利用しない。本研究では、オフライン最大マージン問題をその双対定式化を通して研究し、得られた幾何学的洞察を用いて、オンライン設定のための原理的で効率的なアルゴリズムを設計する。本手法の重要な特徴は、オフライン定式化から継承されたその並進不変性であり、これはその性能解析において中心的な役割を果たす。我々の理論的解析は、並進不変量にのみ依存する改善された誤り限界とマージン限界をもたらし、好ましい設定において同じ仮定の下で既存のアルゴリズムよりも強力な保証を提供する。特に、我々のアルゴリズムがシーケンスごとに最大2つの誤りしか犯さないパラメータ領域を特定したのに対し、パーセプトロンは任意に多くの誤りを犯すように強制される可能性がある。実データを用いた数値的研究はさらに、本手法が既存のオンラインアルゴリズムの計算効率に匹敵する一方で、精度においてそれらを大幅に凌駕することを示している。

原文(英語)を表示

Title (EN): Efficient Online Large-Margin Classification via Dual Certificates

arXiv:2509.19670v1 Announce Type: cross
Abstract: Online classification is a central problem in optimization, statistical learning and data science. Classical algorithms such as the perceptron offer efficient updates and finite mistake guarantees on linearly separable data, but they do not exploit the underlying geometric structure of the classification problem. We study the offline maximum margin problem through its dual formulation and use the resulting geometric insights to design a principled and efficient algorithm for the online setting. A key feature of our method is its translation invariance, inherited from the offline formulation, which plays a central role in its performance analysis. Our theoretical analysis yields improved mistake and margin bounds that depend only on translation-invariant quantities, offering stronger guarantees than existing algorithms under the same assumptions in favorable settings. In particular, we identify a parameter regime where our algorithm makes at most two mistakes per sequence, whereas the perceptron can be forced to make arbitrarily many mistakes. Our numerical study on real data further demonstrates that our method matches the computational efficiency of existing online algorithms, while significantly outperforming them in accuracy.

Published: 2025-09-24 19:00 UTC


コメントする