LoSiA:サブネット局在化と最適化による効率的な高ランク微調整

LoSiA:サブネット局在化と最適化による効率的な高ランク微調整

なぜ重要か: 企業や社会への影響が見込まれ、一般メディアにも波及する可能性があります。

ソースを読む(export.arxiv.org)

arXiv:2507.04487v4発表タイプ:replace-cross

要旨:LoRAなどのパラメータ効率の良いファインチューニング(PEFT)手法は、低ランク分解行列を導入することで、学習可能なパラメータ数を大幅に削減します。しかし、既存の手法はドメイン特化タスクにおいて広範な行列乗算を実行するため、計算効率が悪く、ファインチューニングのパフォーマンスが最適化されていません。そこで本研究では、学習過程において重要なパラメータを動的に局在化し最適化する革新的な手法、LoSiA(Low-Resources Subnet Integration Adaptation)を提案します。具体的には、勾配スパース性分析を用いてサブネットワークを特定し、それを学習対象として最適化します。この設計により、サブネットワークのパラメータのみを更新することで効果的な高ランク適応が可能となり、追加の行列乗算を削減します。また、LoRAと比較してトレーニングの待ち時間を約27%削減する、LoSiAの高速実装であるLoSiA-Proも提示します。広範な評価により、本手法はフルファインチューニングと比較してパフォーマンス低下が最小限に抑えられ、ドメイン特化タスクと常識推論タスクにおいて最短のトレーニング時間を要することが示されました。さらに、LoSiAは継続学習における忘却も軽減することを示しています。ソースコードはhttps://github.com/KlozeWang/LoSiAで公開しています。

原文(英語)を表示

Title (EN): LoSiA: Efficient High-Rank Fine-Tuning via Subnet Localization and Optimization

arXiv:2507.04487v4 Announce Type: replace-cross
Abstract: Parameter-Efficient Fine-Tuning (PEFT) methods, such as LoRA, significantly reduce the number of trainable parameters by introducing low-rank decomposition matrices. However, existing methods perform extensive matrix multiplications in domain specialization tasks, resulting in computational inefficiency and sub-optimal fine-tuning performance. Hence, we propose LoSiA(Low-Resources Subnet Integration Adaptation), an innovative method that dynamically localizes and optimizes critical parameters during the training process. Specifically, it identifies a sub-network using gradient sparsity analysis and optimizes it as the trainable target. This design enables effective high-rank adaptation by updating only the sub-network parameters, reducing the additional matrix multiplication. We also present LoSiA-Pro, a faster implementation of LoSiA, which reduces the training latency by about $27\%$ compared to LoRA. Extensive evaluations show that our method achieves minimal performance drop compared to full fine-tuning, while requiring the least training time across domain specialization and common-sense reasoning tasks. Further analysis shows that LoSiA also reduces forgetting during continued training. The source code is available at https://github.com/KlozeWang/LoSiA.

Published: 2025-09-24 19:00 UTC


コメントする