ナノバイオエージェント(NBA):ゲノミクスのための小型言語モデルエージェント

ナノバイオエージェント(NBA):ゲノミクスのための小型言語モデルエージェント

なぜ重要か: 企業や社会への影響が見込まれ、一般メディアにも波及する可能性があります。

ソースを読む(export.arxiv.org)

arXiv:2509.19566v1発表タイプ:新規

要約:本研究は、幻覚問題と計算コストの課題に対処するため、エージェントフレームワークを用いたゲノム質問応答への小規模言語モデル(パラメータ数100億未満)の適用について調査する。実装したNano Bio-Agent(NBA)フレームワークは、タスク分解、ツールオーケストレーション、NCBIやAlphaGenomeといった確立されたシステムへのAPIアクセスを統合する。結果は、このようなエージェントフレームワークと組み合わせたSLMが、より大規模なモデルを用いた既存のアプローチと比較して同等か、多くの場合、優れた性能を達成できることを示している。最高性能のモデル・エージェントの組み合わせは、GeneTuringベンチマークで98%の精度を達成した。特に、パラメータ数30億~100億の小規模モデルは、一貫して85~97%の精度を達成しながら、従来のアプローチよりもはるかに低い計算資源しか必要としない。これは、高い堅牢性と精度を維持しながら、効率性の向上、コスト削減、そしてMLを活用したゲノムツールの民主化に大きな可能性を示している。

原文(英語)を表示

Title (EN): Nano Bio-Agents (NBA): Small Language Model Agents for Genomics

arXiv:2509.19566v1 Announce Type: new
Abstract: We investigate the application of Small Language Models (<10 billion parameters) for genomics question answering via agentic framework to address hallucination issues and computational cost challenges. The Nano Bio-Agent (NBA) framework we implemented incorporates task decomposition, tool orchestration, and API access into well-established systems such as NCBI and AlphaGenome. Results show that SLMs combined with such agentic framework can achieve comparable and in many cases superior performance versus existing approaches utilising larger models, with our best model-agent combination achieving 98% accuracy on the GeneTuring benchmark. Notably, small 3-10B parameter models consistently achieve 85-97% accuracy while requiring much lower computational resources than conventional approaches. This demonstrates promising potential for efficiency gains, cost savings, and democratization of ML-powered genomics tools while retaining highly robust and accurate performance.

Published: 2025-09-24 19:00 UTC


コメントする