ncRNA分類のためのHyperGraphMambaベース多チャネル適応モデル
なぜ重要か: 企業や社会への影響が見込まれ、一般メディアにも波及する可能性があります。
arXiv:2509.20240v1発表タイプ:クロス
概要:ノンコーディングRNA(ncRNA)は、遺伝子発現調節や様々な疾患の発症において中心的な役割を果たしています。ncRNAの正確な分類は、機能アノテーションと疾患診断に不可欠です。特徴抽出の深さとマルチモーダル融合における既存の限界に対処するため、本研究では、ncRNAの配列、二次構造、およびオプションで利用可能な発現特徴を統合して分類性能を向上させる、HyperGraphMambaベースのマルチチャネル適応モデルであるHGMamba-ncRNAを提案します。具体的には、ncRNAの配列は、ヌクレオチドの局所パターンと長距離依存性を捉えるために、並列マルチスケール畳み込みとLSTMアーキテクチャ(MKC-L)を用いてモデル化されます。構造モダリティは、マルチスケールグラフトランスフォーマー(MSGraphTransformer)を用いて、ncRNA二次構造の多レベルのトポロジ特性を表します。発現モダリティは、チェビシェフ多項式に基づくKolmogorov-Arnoldネットワーク(CPKAN)を用いて、高次元発現プロファイルを効果的にモデル化および解釈します。最後に、効率的で包括的なマルチモーダル相互作用を促進するために仮想ノードを組み込むことで、HyperGraphMambaはマルチチャネル異種モダリティ特徴を適応的に整列および統合するように提案されています。3つの公開データセットで行われた実験は、HGMamba-ncRNAが精度と他の指標において最先端の方法を常に凌駕することを示しています。広範な経験的研究は、モデルの堅牢性、有効性、および強力な転移可能性をさらに確認しており、複雑なncRNA機能分類のための新規かつ信頼性の高い戦略を提供します。コードとデータセットはhttps://anonymous.4open.science/r/HGMamba-ncRNA-94D0で入手可能です。
原文(英語)を表示
Title (EN): A HyperGraphMamba-Based Multichannel Adaptive Model for ncRNA Classification
arXiv:2509.20240v1 Announce Type: cross
Abstract: Non-coding RNAs (ncRNAs) play pivotal roles in gene expression regulation and the pathogenesis of various diseases. Accurate classification of ncRNAs is essential for functional annotation and disease diagnosis. To address existing limitations in feature extraction depth and multimodal fusion, we propose HGMamba-ncRNA, a HyperGraphMamba-based multichannel adaptive model, which integrates sequence, secondary structure, and optionally available expression features of ncRNAs to enhance classification performance. Specifically, the sequence of ncRNA is modeled using a parallel Multi-scale Convolution and LSTM architecture (MKC-L) to capture both local patterns and long-range dependencies of nucleotides. The structure modality employs a multi-scale graph transformer (MSGraphTransformer) to represent the multi-level topological characteristics of ncRNA secondary structures. The expression modality utilizes a Chebyshev Polynomial-based Kolmogorov-Arnold Network (CPKAN) to effectively model and interpret high-dimensional expression profiles. Finally, by incorporating virtual nodes to facilitate efficient and comprehensive multimodal interaction, HyperGraphMamba is proposed to adaptively align and integrate multichannel heterogeneous modality features. Experiments conducted on three public datasets demonstrate that HGMamba-ncRNA consistently outperforms state-of-the-art methods in terms of accuracy and other metrics. Extensive empirical studies further confirm the model’s robustness, effectiveness, and strong transferability, offering a novel and reliable strategy for complex ncRNA functional classification. Code and datasets are available at https://anonymous.4open.science/r/HGMamba-ncRNA-94D0.
Published: 2025-09-24 19:00 UTC