E2E学習によるマルチモーダル意味非直交伝送融合の大規模MIMO
なぜ重要か: 企業や社会への影響が見込まれ、一般メディアにも波及する可能性があります。
arXiv:2509.19312v1発表形式:クロス
概要:大規模多入力多出力(MIMO)は高いスペクトル効率を約束する一方、高次元のダウンリンクチャネル状態情報(CSI)をもたらし、リアルタイムでのチャネル取得とプリコーディングを複雑化する。これに対処するため、ダウンリンクCSI参照信号(CSI-RS)設計、CSIフィードバック、基地局(BS)プリコーディングを単一のエンドツーエンド(E2E)ニューラルアーキテクチャ内で共同モデリングするE2Eアップリンク-ダウンリンクCSI融合プリコーディングネットワークを提案する。具体的には、MAXIMアーキテクチャ上に構築された投影ネットワークがアップリンクサウンディング参照信号(SRS)を入力として受け取り、ダウンリンクCSI-RS設計のための周波数、ビーム、ポートドメイン投影行列を出力する。その後、ユーザ機器(UE)は得られたCSI-RS観測値を圧縮/量子化し、コンパクトな表現をフィードバックする。基地局(BS)では、2つの補完的なブランチが候補プリコーダを生成する。1つは量子化されたダウンリンク観測値によって駆動されるフィードバック専用プリコーディングネットワークであり、もう1つはアップリンクSRSによって駆動されるSRS専用プリコーディングネットワークである。これらの候補プリコーダはその後、融合プリコーディングネットワークによって結合され、最終的な送信プリコーダが生成される。全てのモジュールは、3段階スケジュールの下でスペクトル効率指向の損失で訓練される。シミュレーション結果は、提案手法がSRS由来の情報とUEフィードバックの両方を効果的に活用し、従来のベースラインよりも著しく優れた性能を達成することを示している。
原文(英語)を表示
Title (EN): E2E Learning Massive MIMO for Multimodal Semantic Non-Orthogonal Transmission and Fusion
arXiv:2509.19312v1 Announce Type: cross
Abstract: Massive multiple-input multiple-output (MIMO) promises high spectral efficiency but also leads to high-dimensional downlink channel state information (CSI), which complicates real-time channel acquisition and precoding. To address this, we propose an end-to-end (E2E) uplink-downlink CSI fusion precoding network that jointly models downlink CSI reference signal (CSI-RS) design, CSI feedback, and base-station (BS) precoding within a single E2E neural architecture. Concretely, a projection network built on the MAXIM architecture takes uplink sounding reference signals (SRS) as input and outputs frequency-, beam-, and port-domain projection matrices for designing downlink CSI-RS. User equipment (UE) then compresses/quantizes the resulting CSI-RS observations and feeds back a compact representation. At the base station (BS), two complementary branches produce candidate precoders: one is a feedback-only precoding network driven by quantized downlink observations, and the other is an SRS-only precoding network driven by uplink SRS. These candidate precoders are subsequently combined by a fusion precoding network to yield the final transmit precoder. All the modules are trained with a spectral-efficiency-oriented loss under a three-stage schedule. Simulation results show that the proposed approach effectively harnesses both SRS-derived information and UE feedback, achieving markedly better performance than conventional baselines.
Published: 2025-09-24 19:00 UTC