ボードゲームにおけるプロセスマイニングを用いた説明可能なマルチエージェントMCTS-ミニマックスハイブリッドの探求

ボードゲームにおけるプロセスマイニングを用いた説明可能なマルチエージェントMCTS-ミニマックスハイブリッドの探求

なぜ重要か: 企業や社会への影響が見込まれ、一般メディアにも波及する可能性があります。

ソースを読む(export.arxiv.org)

arXiv:2503.23326v3 発表種別:差し替え

要約:モンテカルロ木探索(MCTS)は、逐次意思決定領域におけるオンライン計画に広く用いられるサンプリングベースの探索アルゴリズム群であり、人工知能における最近の多くの進歩の中核をなしている。多くの可能性のある未来のシミュレーション、それらの評価、およびそれらの関係から生じる、しばしば大きく複雑な探索木のため、MCTSエージェントの行動を開発者や利用者が理解することは困難である。本論文は、MCTSの意思決定と行動に対する潜在的な説明に関する我々の継続中の調査を紹介する。MCTSの弱点として、非常に選択的な木を構築し、その結果、重要な手を逃し、戦術的な罠に陥ることが挙げられる。全幅探索ミニマックス法が解決策となる。我々は、浅いミニマックス探索を複数エージェントMCTSのロールアウトフェーズに統合し、プロセスマイニング手法を用いて3対3チェッカーにおけるエージェントの戦略を説明する。

原文(英語)を表示

Title (EN): Exploring Explainable Multi-agent MCTS-minimax Hybrids in Board Game Using Process Mining

arXiv:2503.23326v3 Announce Type: replace
Abstract: Monte-Carlo Tree Search (MCTS) is a family of sampling-based search algorithms widely used for online planning in sequential decision-making domains and at the heart of many recent advances in artificial intelligence. Understanding the behavior of MCTS agents is difficult for developers and users due to the frequently large and complex search trees that result from the simulation of many possible futures, their evaluations, and their relationships. This paper presents our ongoing investigation into potential explanations for the decision-making and behavior of MCTS. A weakness of MCTS is that it constructs a highly selective tree and, as a result, can miss crucial moves and fall into tactical traps. Full-width minimax search constitutes the solution. We integrate shallow minimax search into the rollout phase of multi-agent MCTS and use process mining technique to explain agents’ strategies in 3v3 checkers.

Published: 2025-09-24 19:00 UTC


コメントする