アルツハイマー病検出のためのMMSE較正少ショットプロンプティング

アルツハイマー病検出のためのMMSE較正少ショットプロンプティング

なぜ重要か: 企業や社会への影響が見込まれ、一般メディアにも波及する可能性があります。

ソースを読む(export.arxiv.org)

arXiv:2509.19926v1発表、新規。

要約:大規模言語モデルのプロンプトエンジニアリングは、音声転写記録からアルツハイマー病を検出するための訓練不要な手法である。ADReSSデータセットを用いて、ゼロショットプロンプティングを再検討し、ネスト型インターリーブと厳格なスキーマを用いたクラスバランスプロトコルによる少ショットプロンプティングを、クラスあたり最大20個の例を用いて調査した。最先端のプロンプティング結果を達成する2つのバリアントを評価した。(i) MMSE-Proxyプロンプティング:各少ショット例は、決定論的なマッピングを介してミニメンタルステート検査(MMSE)バンドに固定された確率を運び、AUC計算を可能にする。これは0.82の精度と0.86のAUCに達する。(ii) 推論拡張プロンプティング:少ショット例のプールは、Cookie Theft画像、転写記録、MMSEを入力として推論とMMSE整合確率を出力するマルチモーダルLLM(GPT-5)を用いて生成される。評価は転写記録のみで行われ、0.82の精度と0.83のAUCに達する。我々の知る限り、これは誘起された確率をMMSEに固定し、マルチモーダル構成を用いて解釈可能性を向上させた最初のADReSS研究である。

原文(英語)を表示

Title (EN): MMSE-Calibrated Few-Shot Prompting for Alzheimer’s Detection

arXiv:2509.19926v1 Announce Type: new
Abstract: Prompting large language models is a training-free method for detecting Alzheimer’s disease from speech transcripts. Using the ADReSS dataset, we revisit zero-shot prompting and study few-shot prompting with a class-balanced protocol using nested interleave and a strict schema, sweeping up to 20 examples per class. We evaluate two variants achieving state-of-the-art prompting results. (i) MMSE-Proxy Prompting: each few-shot example carries a probability anchored to Mini-Mental State Examination bands via a deterministic mapping, enabling AUC computing; this reaches 0.82 accuracy and 0.86 AUC (ii) Reasoning-augmented Prompting: few-shot examples pool is generated with a multimodal LLM (GPT-5) that takes as input the Cookie Theft image, transcript, and MMSE to output a reasoning and MMSE-aligned probability; evaluation remains transcript-only and reaches 0.82 accuracy and 0.83 AUC. To our knowledge, this is the first ADReSS study to anchor elicited probabilities to MMSE and to use multimodal construction to improve interpretability.

Published: 2025-09-24 19:00 UTC


コメントする