LegalSearchLM:法的事例検索を法的要素生成として再考する
なぜ重要か: 企業や社会への影響が見込まれ、一般メディアにも波及する可能性があります。
arXiv:2505.23832v2発表タイプ: 置換
要約:照会事件から関連事件を検索する法的事件検索(LCR)は、調査と意思決定における法律専門家にとって基本的なタスクです。しかし、既存のLCRに関する研究は、2つの主要な限界に直面しています。第一に、比較的小規模な検索コーパス(例:100~55,000件)で評価されており、限られた種類の犯罪照会を使用しているため、現実世界の法的検索シナリオの複雑さを十分に反映できません。第二に、埋め込みベースまたは語彙一致手法への依存により、表現が限定され、法的に無関係な一致が生じることがよくあります。これらの問題に対処するため、(1) 120万件以上の候補事件に対する照会で411種類の多様な犯罪類型を網羅した、大規模な韓国語LCRベンチマークであるLEGAR BENCH、および(2) 照会事件について法的要素の推論を行い、制約付きデコーディングを通じて対象事件に基づいた、それらの要素を含むコンテンツを直接生成する検索モデルであるLegalSearchLMを提示します。実験結果は、LegalSearchLMがLEGAR BENCHにおいてベースラインを6~20%上回り、最先端の性能を達成することを示しています。また、ドメイン外の事件に対する強力な汎化性能も示しており、ドメイン内データで訓練されたナイーブな生成モデルを15%上回っています。
原文(英語)を表示
Title (EN): LegalSearchLM: Rethinking Legal Case Retrieval as Legal Elements Generation
arXiv:2505.23832v2 Announce Type: replace
Abstract: Legal Case Retrieval (LCR), which retrieves relevant cases from a query case, is a fundamental task for legal professionals in research and decision-making. However, existing studies on LCR face two major limitations. First, they are evaluated on relatively small-scale retrieval corpora (e.g., 100-55K cases) and use a narrow range of criminal query types, which cannot sufficiently reflect the complexity of real-world legal retrieval scenarios. Second, their reliance on embedding-based or lexical matching methods often results in limited representations and legally irrelevant matches. To address these issues, we present: (1) LEGAR BENCH, the first large-scale Korean LCR benchmark, covering 411 diverse crime types in queries over 1.2M candidate cases; and (2) LegalSearchLM, a retrieval model that performs legal element reasoning over the query case and directly generates content containing those elements, grounded in the target cases through constrained decoding. Experimental results show that LegalSearchLM outperforms baselines by 6-20% on LEGAR BENCH, achieving state-of-the-art performance. It also demonstrates strong generalization to out-of-domain cases, outperforming naive generative models trained on in-domain data by 15%.
Published: 2025-09-24 19:00 UTC