状態デルタ軌跡によるマルチエージェントコミュニケーションの拡張

状態デルタ軌跡によるマルチエージェントコミュニケーションの拡張

なぜ重要か: 企業や社会への影響が見込まれ、一般メディアにも波及する可能性があります。

ソースを読む(export.arxiv.org)

arXiv:2506.19209v2 発表種別:差し替え

要約:ロールプレイングや複数ターンにわたる議論といったマルチエージェント手法は、下流タスクにおける大規模言語モデル(LLM)の性能向上に有効であることが示されている。既存の単一ベースLLMから構築されたマルチエージェントシステムは、ワークフローの違いにもかかわらず、主に自然言語をエージェント間のコミュニケーションに使用している。これは簡潔で解釈しやすいという利点がある一方、あるモデルが連続的な状態ベクトルを離散的なトークンにダウンサンプリングして他のモデルに転送する必要があるため、不可避的な情報損失が生じる。このような損失は、転送する情報が単純な事実ではなく、推論ロジックや抽象的な思考である場合に特に顕著である。この問題に対処するため、自然言語トークンとトークンごとの状態遷移軌跡の両方をエージェント間で転送する新しいコミュニケーションプロトコルを提案する。特に、実際の状態値と比較して、各トークン生成後のLLMにおける状態変化のシーケンスの方が、推論プロセスに隠された情報をより適切に反映できることを発見した。状態遷移軌跡を表すState Delta Encoding (SDE)手法を提案する。実験結果から、SDEを用いたマルチエージェントシステムは、他のコミュニケーションプロトコルと比較して、特に複雑な推論を伴うタスクにおいてSOTA性能を達成することが示された。

原文(英語)を表示

Title (EN): Augmenting Multi-Agent Communication with State Delta Trajectory

arXiv:2506.19209v2 Announce Type: replace
Abstract: Multi-agent techniques such as role playing or multi-turn debates have been shown to be effective in improving the performance of large language models (LLMs) in downstream tasks. Despite their differences in workflows, existing multi-agent systems constructed from a single base LLM mostly use natural language for agent communication. While this is appealing for its simplicity and interpretability, it also introduces inevitable information loss as one model must down sample its continuous state vectors to discrete tokens before transferring them to the other model. Such losses are particularly significant when the information to transfer is not simple facts, but reasoning logics or abstractive thoughts. To tackle this problem, we propose a new communication protocol that transfers both natural language tokens and token-wise state transition trajectory from one agent to another. Particularly, compared to the actual state value, we find that the sequence of state changes in LLMs after generating each token can better reflect the information hidden behind the inference process. We propose a State Delta Encoding (SDE) method to represent state transition trajectories. The experimental results show that multi-agent systems with SDE achieve SOTA performance compared to other communication protocols, particularly in tasks that involve complex reasoning.

Published: 2025-09-24 19:00 UTC


コメントする