挙動と内部構造によるマージ手法評価パイプライン

挙動と内部構造によるマージ手法評価パイプライン

なぜ重要か: 企業や社会への影響が見込まれ、一般メディアにも波及する可能性があります。

ソースを読む(export.arxiv.org)

arXiv:2509.19476v1発表タイプ:新規

概要:複数の言語モデル(LM)の重みを統合する手法は、ドメイン適応など、それぞれの能力を活用するために用いられる。既存の研究は統合モデルを行動面からのみ調査しているが、本研究は、その行動と内部構造を評価し、関連付けることで、初めて包括的な視点を与える。本研究では、まず複数の親LMを統合し、次にMMLUなどの下流タスクにおける行動と、内部にエンコードされた言語能力に基づいて、統合モデルを初期モデルと比較評価する、新規の評価パイプラインを提示する。このパイプラインを用いて、Qwen2.5ファミリーからの数学・コード適応済み命令微調整LMの統合を評価する。その結果、統合手法は行動と内部構造に異なる影響を与えることが示された。統合モデルのパフォーマンスは通常、2つの親モデルの中間にあるものの、形態論や構文における言語現象に関するエンコード情報は、親モデルを上回る可能性がある。さらに、この行動と内部評価の間には弱いランキング相関が見られた。本研究のパイプラインと初期結果から、潜在的な表面的な行動の進歩を超えて、その能力と信頼性を正しく理解するためには、モデル統合手法のより包括的な評価が必要であることを強調する。

原文(英語)を表示

Title (EN): A Pipeline to Assess Merging Methods via Behavior and Internals

arXiv:2509.19476v1 Announce Type: new
Abstract: Merging methods combine the weights of multiple language models (LMs) to leverage their capacities, such as for domain adaptation. While existing studies investigate merged models from a solely behavioral perspective, we offer the first comprehensive view by assessing and connecting their behavior and internals. We present a novel evaluation pipeline that first merges multiple parent LMs, and then evaluates the merged models in comparison to the initial ones based on their behavior on downstream tasks, like MMLU, and the internal encoded linguistic competence. We showcase this pipeline by assessing the merging of instruction fine-tuned with math- and code-adapted LMs from the Qwen2.5 family. Our results show that merging methods impacts behavior and internals differently. While the performance of merged models is typically between that of the two parent models, their encoded information about linguistic phenomena, particularly in morphology and syntax, can surpass the parent models. Moreover, we find weak ranking correlation between this behavior and internal evaluation. With our pipeline and initial results, we emphasize the need for more comprehensive evaluations of model merging methods to gain a faithful understanding of their capabilities and reliability, beyond potential superficial behavioral advances.

Published: 2025-09-24 19:00 UTC


コメントする