Meow:自動化された学術調査のためのエンドツーエンドアウトライン作成
なぜ重要か: 企業や社会への影響が見込まれ、一般メディアにも波及する可能性があります。
arXiv:2509.19370v1発表種別:クロス
概要:学術論文発表数の指数関数的な増加に伴い、LLMを用いた包括的な調査の自動化は避けられないトレンドとなっている。関連研究を体系的に整理することを目的としたアウトライン作成は、自動調査生成において極めて重要である。しかし、既存の自動調査手法は、アウトライン作成を全体パイプラインにおける単なるワークフローステップとして扱っている。このようなテンプレートベースのワークフローでは、調査対象への深い理解と詳細なスタイルを欠いたアウトラインが生成される。これらの限界に対処するため、本稿では、体系的で忠実なアウトラインを効率的に生成する、メタデータ駆動型アウトライン作成フレームワークであるMeowを提案する。具体的には、論文メタデータから階層構造化されたアウトラインを生成するエンドツーエンドタスクとしてアウトライン作成を定式化する。次に、arXiv、bioRxiv、medRxivからの調査の高品質なデータセットを作成し、アウトライン品質評価のための体系的な評価指標を確立する。最後に、教師ありファインチューニングと強化学習を組み合わせた二段階トレーニングアプローチを採用する。我々の8B推論モデルは、高い構造的忠実度とスタイルの一貫性を備え、優れた性能を示す。
原文(英語)を表示
Title (EN): Meow: End-to-End Outline Writing for Automatic Academic Survey
arXiv:2509.19370v1 Announce Type: cross
Abstract: As academic paper publication numbers grow exponentially, conducting in-depth surveys with LLMs automatically has become an inevitable trend. Outline writing, which aims to systematically organize related works, is critical for automated survey generation. Yet existing automatic survey methods treat outline writing as mere workflow steps in the overall pipeline. Such template-based workflows produce outlines that lack in-depth understanding of the survey topic and fine-grained styles. To address these limitations, we propose Meow, the first metadata-driven outline writing framework that produces organized and faithful outlines efficiently. Specifically, we first formulate outline writing as an end-to-end task that generates hierarchical structured outlines from paper metadata. We then curate a high-quality dataset of surveys from arXiv, bioRxiv, and medRxiv, and establish systematic evaluation metrics for outline quality assessment. Finally, we employ a two-stage training approach combining supervised fine-tuning and reinforcement learning. Our 8B reasoning model demonstrates strong performance with high structural fidelity and stylistic coherence.
Published: 2025-09-24 19:00 UTC