統一的記号音楽編曲:トラック認識再構成と構造化トークン化
なぜ重要か: 企業や社会への影響が見込まれ、一般メディアにも波及する可能性があります。
arXiv:2408.15176v3 は、多様な編曲シナリオ(再解釈、簡略化、加法的生成を含む)に対応可能な単一の事前学習済み記号音楽モデルを用いた、自動マルチトラック音楽編曲のための統一フレームワークを示しています。その核心は、トークンレベルで分離された内容とスタイルを操作するセグメントレベルの再構成目標であり、推論時に柔軟な任意の楽器変換を可能にします。トラックごとのモデリングを支援するため、マルチトラック記号音楽のための構造化トークン化スキームREMI-zを導入し、編曲タスクと無条件生成の両方におけるモデリングの効率性と有効性を向上させました。本手法は、バンド編曲、ピアノ簡約、ドラム編曲といった様々な編曲シナリオにおける代表的なタスクにおいて、客観的指標と知覚評価の両方で、タスク固有の最先端モデルを凌駕します。総合的に、本フレームワークは強力な汎用性を示し、記号音楽から音楽への変換におけるより広範な適用可能性を示唆しています。
原文(英語)を表示
Title (EN): Unifying Symbolic Music Arrangement: Track-Aware Reconstruction and Structured Tokenization
arXiv:2408.15176v3 Announce Type: replace-cross
Abstract: We present a unified framework for automatic multitrack music arrangement that enables a single pre-trained symbolic music model to handle diverse arrangement scenarios, including reinterpretation, simplification, and additive generation. At its core is a segment-level reconstruction objective operating on token-level disentangled content and style, allowing for flexible any-to-any instrumentation transformations at inference time. To support track-wise modeling, we introduce REMI-z, a structured tokenization scheme for multitrack symbolic music that enhances modeling efficiency and effectiveness for both arrangement tasks and unconditional generation. Our method outperforms task-specific state-of-the-art models on representative tasks in different arrangement scenarios — band arrangement, piano reduction, and drum arrangement, in both objective metrics and perceptual evaluations. Taken together, our framework demonstrates strong generality and suggests broader applicability in symbolic music-to-music transformation.
Published: 2025-09-24 19:00 UTC