大規模言語モデルエージェントを用いた自律型CTプロトコル管理に向けたScan-do Attitude

大規模言語モデルエージェントを用いた自律型CTプロトコル管理に向けたScan-do Attitude

なぜ重要か: 企業や社会への影響が見込まれ、一般メディアにも波及する可能性があります。

ソースを読む(export.arxiv.org)

arXiv:2509.20270v1発表タイプ:新規

概要:Computed Tomography(CT)におけるスキャンプロトコルの管理、すなわち取得パラメータの調整や再構成の設定、患者特異的な後処理ツールの選択は、時間と臨床的・技術的な専門知識を必要とする、時間のかかる作業です。同時に、放射線科における熟練労働力の不足が深刻化しています。この問題に対処するため、自然言語または構造化されたデバイス非依存形式で与えられたプロトコル設定要求の解釈と実行を支援する、大規模言語モデル(LLM)ベースのエージェントフレームワークを提案します。これは、ワークフローの効率化と技術者の作業負荷軽減を目指しています。このエージェントは、コンテキスト学習、指示に従う能力、構造化されたツール呼び出し能力を組み合わせることで、関連するプロトコル要素を特定し、正確な修正を適用します。体系的な評価において、実験結果は、エージェントがプロトコルコンポーネントを効果的に取得し、デバイス互換性のあるプロトコル定義ファイルを生成し、ユーザー要求を忠実に実装できることを示しています。原理的には実現可能性を示していますが、統一されたデバイスAPIの不足による構文的および意味的な妥当性に関する限界、および曖昧または複雑な要求に関する課題に直面しています。要約すると、これらの知見は、CT画像におけるスキャンプロトコル管理を支援するためのLLMベースのエージェントに向けた明確な道筋を示しています。

原文(英語)を表示

Title (EN): Scan-do Attitude: Towards Autonomous CT Protocol Management using a Large Language Model Agent

arXiv:2509.20270v1 Announce Type: new
Abstract: Managing scan protocols in Computed Tomography (CT), which includes adjusting acquisition parameters or configuring reconstructions, as well as selecting postprocessing tools in a patient-specific manner, is time-consuming and requires clinical as well as technical expertise. At the same time, we observe an increasing shortage of skilled workforce in radiology. To address this issue, a Large Language Model (LLM)-based agent framework is proposed to assist with the interpretation and execution of protocol configuration requests given in natural language or a structured, device-independent format, aiming to improve the workflow efficiency and reduce technologists’ workload. The agent combines in-context-learning, instruction-following, and structured toolcalling abilities to identify relevant protocol elements and apply accurate modifications. In a systematic evaluation, experimental results indicate that the agent can effectively retrieve protocol components, generate device compatible protocol definition files, and faithfully implement user requests. Despite demonstrating feasibility in principle, the approach faces limitations regarding syntactic and semantic validity due to lack of a unified device API, and challenges with ambiguous or complex requests. In summary, the findings show a clear path towards LLM-based agents for supporting scan protocol management in CT imaging.

Published: 2025-09-24 19:00 UTC


コメントする