PathGene:多施設肺癌組織病理画像データセットを用いたドライバー遺伝子変異とエクソン予測のベンチマーク
なぜ重要か: パフォーマンス指標が更新され、選定・置換の判断材料になります。
arXiv:2506.00096v2発表種類: replace-cross
要旨: 肺癌における遺伝子変異、変異サブタイプ、およびそれらのエクソンの正確な予測は、個別化治療計画と予後評価に不可欠です。医療資源の地域格差とゲノムアッセイの高コストに直面して、人工知能を用いてこれらの変異とエクソン変異をルーチンの組織病理学的画像から推測することは、精密医療を大きく促進する可能性があります。いくつかの以前の研究では、深層学習が肺癌病理組織スライドからの主要な遺伝子変異の予測を加速できることが示されていますが、その性能は依然として最適ではなく、これまでのところ主に早期スクリーニングタスクに限定されていました。これらの限界に対処するために、私たちは、中南大学第二湘雅医院の1,576人の患者と448人のTCGA-LUAD患者の次世代シーケンスレポートとペアになった組織病理学的画像を含むPathGeneを構築しました。この多施設データセットは、全スライド画像をドライバー遺伝子変異の状態、変異サブタイプ、エクソン、腫瘍変異負荷(TMB)の状態にリンクし、組織病理学的画像を利用して、早期遺伝子スクリーニングのための変異、サブタイプ、エクソン位置、TMBを予測し、精密腫瘍学を進歩させることを目的としています。既存のデータセットとは異なり、PathGeneでは組織病理学的画像に関連する分子レベルの情報を提供して、バイオマーカー予測モデルの開発を促進します。変異、サブタイプ、エクソン、TMB予測タスクについて、PathGeneで11種類の多インスタンス学習手法をベンチマークしました。これらの実験手法は、肺癌患者の早期遺伝子スクリーニングと、臨床医が患者の個別化精密標的治療計画を迅速に策定するための支援に役立つ貴重な代替手段を提供します。コードとデータはhttps://github.com/panliangrui/NIPS2025/で入手可能です。
原文(英語)を表示
Title (EN): PathGene: Benchmarking Driver Gene Mutations and Exon Prediction Using Multicenter Lung Cancer Histopathology Image Dataset
arXiv:2506.00096v2 Announce Type: replace-cross
Abstract: Accurately predicting gene mutations, mutation subtypes and their exons in lung cancer is critical for personalized treatment planning and prognostic assessment. Faced with regional disparities in medical resources and the high cost of genomic assays, using artificial intelligence to infer these mutations and exon variants from routine histopathology images could greatly facilitate precision therapy. Although some prior studies have shown that deep learning can accelerate the prediction of key gene mutations from lung cancer pathology slides, their performance remains suboptimal and has so far been limited mainly to early screening tasks. To address these limitations, we have assembled PathGene, which comprises histopathology images paired with next-generation sequencing reports from 1,576 patients at the Second Xiangya Hospital, Central South University, and 448 TCGA-LUAD patients. This multi-center dataset links whole-slide images to driver gene mutation status, mutation subtypes, exon, and tumor mutational burden (TMB) status, with the goal of leveraging pathology images to predict mutations, subtypes, exon locations, and TMB for early genetic screening and to advance precision oncology. Unlike existing datasets, we provide molecular-level information related to histopathology images in PathGene to facilitate the development of biomarker prediction models. We benchmarked 11 multiple-instance learning methods on PathGene for mutation, subtype, exon, and TMB prediction tasks. These experimental methods provide valuable alternatives for early genetic screening of lung cancer patients and assisting clinicians to quickly develop personalized precision targeted treatment plans for patients. Code and data are available at https://github.com/panliangrui/NIPS2025/.
Published: 2025-09-24 19:00 UTC