PGCLODA:オリゴペプチド感染症関連予測のためのプロンプト誘導グラフコントラスト学習
なぜ重要か: 企業や社会への影響が見込まれ、一般メディアにも波及する可能性があります。
arXiv:2509.20290v1発表タイプ:クロス
概要:感染症は依然として公衆衛生に対する深刻な脅威であり、新規抗感染薬をスクリーニングするための効果的な計算アプローチの緊急的な必要性を強調している。オリゴペプチドは、その構造の単純性、高いバイオアベイラビリティ、および耐性への低い感受性から、抗菌研究における有望な候補として台頭している。その可能性にもかかわらず、オリゴペプチドと感染症との関連性を予測するために特化した計算モデルは依然として少ない。本研究は、潜在的な関連性を明らかにするためのプロンプトガイド型グラフベースコントラスティブ学習フレームワーク(PGCLODA)を紹介する。オリゴペプチド、微生物、および疾患をノードとする三部グラフが構築され、構造情報と意味情報の両方が組み込まれる。コントラスティブ学習中に重要な領域を維持するために、プロンプトガイド型グラフ拡張戦略が用いられ、意味のあるペアビューが生成される。グラフ畳み込みネットワーク(GCN)とTransformerを統合したデュアルエンコーダーアーキテクチャを用いて、局所的および大域的特徴を共同で捉える。融合された埋め込みは、その後、多層パーセプトロン(MLP)分類器に入力され、最終的な予測が行われる。ベンチマークデータセットでの実験結果は、PGCLODAがAUROC、AUPRC、および精度において最先端モデルを常に凌駕することを示している。アブレーション研究とハイパーパラメータ研究は、各モジュールの貢献を確認している。ケーススタディはさらに、PGCLODAの汎化能力とその新規で生物学的に関連する関連性を明らかにする可能性を検証している。これらの知見は、メカニズム駆動型創薬およびオリゴペプチドベースの医薬品開発にとって貴重な洞察を提供する。PGCLODAのソースコードは、https://github.com/jjnlcode/PGCLODAでオンラインで公開されている。
原文(英語)を表示
Title (EN): PGCLODA: Prompt-Guided Graph Contrastive Learning for Oligopeptide-Infectious Disease Association Prediction
arXiv:2509.20290v1 Announce Type: cross
Abstract: Infectious diseases continue to pose a serious threat to public health, underscoring the urgent need for effective computational approaches to screen novel anti-infective agents. Oligopeptides have emerged as promising candidates in antimicrobial research due to their structural simplicity, high bioavailability, and low susceptibility to resistance. Despite their potential, computational models specifically designed to predict associations between oligopeptides and infectious diseases remain scarce. This study introduces a prompt-guided graph-based contrastive learning framework (PGCLODA) to uncover potential associations. A tripartite graph is constructed with oligopeptides, microbes, and diseases as nodes, incorporating both structural and semantic information. To preserve critical regions during contrastive learning, a prompt-guided graph augmentation strategy is employed to generate meaningful paired views. A dual encoder architecture, integrating Graph Convolutional Network (GCN) and Transformer, is used to jointly capture local and global features. The fused embeddings are subsequently input into a multilayer perceptron (MLP) classifier for final prediction. Experimental results on a benchmark dataset indicate that PGCLODA consistently outperforms state-of-the-art models in AUROC, AUPRC, and accuracy. Ablation and hyperparameter studies confirm the contribution of each module. Case studies further validate the generalization ability of PGCLODA and its potential to uncover novel, biologically relevant associations. These findings offer valuable insights for mechanism-driven discovery and oligopeptide-based drug development. The source code of PGCLODA is available online at https://github.com/jjnlcode/PGCLODA.
Published: 2025-09-24 19:00 UTC