大規模言語モデルの自動医療文書化に向けた効率的ファインチューニング

大規模言語モデルの自動医療文書化に向けた効率的ファインチューニング

なぜ重要か: 企業や社会への影響が見込まれ、一般メディアにも波及する可能性があります。

ソースを読む(export.arxiv.org)

arXiv:2409.09324v3発表種類:差し替え

抄録:医学研究によると、医師は直接的な患者ケアに費やす時間1時間につき、ほぼ2時間もの追加時間を事務作業、特に電子カルテ(EHR)とデスクワークに費やしている。この過剰な事務負担は、患者ケアに利用できる時間を削減するだけでなく、医師の燃え尽き症候群と医療提供における非効率性にも寄与している。これらの課題に対処するため、本研究では、医療対話から医療レポートの生成を自動化するよう設計された微調整済み大規模言語モデル(LLM)であるMediGenを紹介する。LLaMA3-8Bを含むオープンソースの事前学習済みモデルの微調整のための最先端の方法論を活用することで、MediGenは臨床的相互作用の転写と要約において高い精度を達成する。微調整されたLLaMA3-8Bモデルは、ROUGEスコア58%、BERTScore-F1 72%という有望な結果を示し、正確で臨床的に関連性の高い医療レポートを生成する有効性を示している。これらの知見は、MediGenが医師の事務作業量を大幅に削減し、医療の効率性と医師の幸福の両方を向上させる可能性があることを示唆している。

原文(英語)を表示

Title (EN): Efficient Fine-Tuning of Large Language Models for Automated Medical Documentation

arXiv:2409.09324v3 Announce Type: replace-cross
Abstract: Scientific research indicates that for every hour spent in direct patient care, physicians spend nearly two additional hours on administrative tasks, particularly on electronic health records (EHRs) and desk work. This excessive administrative burden not only reduces the time available for patient care but also contributes to physician burnout and inefficiencies in healthcare delivery. To address these challenges, this study introduces MediGen, a fine-tuned large language model (LLM) designed to automate the generation of medical reports from medical dialogues. By leveraging state-of-the-art methodologies for fine-tuning open-source pretrained models, including LLaMA3-8B, MediGen achieves high accuracy in transcribing and summarizing clinical interactions. The fine-tuned LLaMA3-8B model demonstrated promising results, achieving a ROUGE score of 58% and a BERTScore-F1 of 72%, indicating its effectiveness in generating accurate and clinically relevant medical reports. These findings suggest that MediGen has the potential to significantly reduce the administrative workload on physicians, improving both healthcare efficiency and physician well-being.

Published: 2025-09-24 19:00 UTC


コメントする