Weaver:SQLとLLMを組み合わせたテーブル推論

Weaver:SQLとLLMを組み合わせたテーブル推論

なぜ重要か: 企業や社会への影響が見込まれ、一般メディアにも波及する可能性があります。

ソースを読む(export.arxiv.org)

arXiv:2505.18961v2 発表種別:差し替え

要約: 非構造化データを含むテーブルのクエリは、テーブル内または外部段落に埋め込まれたテキスト(または画像)が存在するため困難であり、特に意味的推論を必要とするタスクでは従来のSQLでは処理が困難です。大規模言語モデル(LLM)はコンテキストの理解に優れていますが、長い入力シーケンスには限界があります。SQLとLLMを組み合わせた既存のアプローチは、通常、厳格で事前に定義されたワークフローに依存しており、複雑なクエリへの適応性が制限されています。これらの問題に対処するため、テーブルベースの質問応答(TableQA)のためにSQLとLLMを動的に統合するモジュール型パイプラインであるWeaverを導入します。Weaverは、構造化データの取得にSQLを、意味処理にLLMを組み合わせた柔軟な段階的計画を生成します。複雑なクエリを管理可能なサブタスクに分解することにより、Weaverは精度と汎化性能を向上させます。実験の結果、Weaverは4つのTableQAデータセットにおいて、最先端の方法を一貫して上回り、API呼び出しとエラー率の両方を削減することが示されました。コードとその他の関連スクリプトは、https://coral-lab-asu.github.io/weaverで入手できます。

原文(英語)を表示

Title (EN): Weaver: Interweaving SQL and LLM for Table Reasoning

arXiv:2505.18961v2 Announce Type: replace
Abstract: Querying tables with unstructured data is challenging due to the presence of text (or image), either embedded in the table or in external paragraphs, which traditional SQL struggles to process, especially for tasks requiring semantic reasoning. While Large Language Models (LLMs) excel at understanding context, they face limitations with long input sequences. Existing approaches that combine SQL and LLMs typically rely on rigid, predefined work-flows, limiting their adaptability to complex queries. To address these issues, we introduce Weaver , a modular pipeline that dynamically integrates SQL and LLMs for table-based question answering (TableQA). Weaver generates a flexible, step-by-step plan that combines SQL for structured data retrieval with LLMs for semantic processing. By decomposing complex queries into manageable subtasks, Weaver improves accuracy and generalization. Our experiments show that Weaver consistently outperforms state-of-the-art methods across four TableQA datasets, reducing both API calls and error rates. The code, along with other associated scripts, are available at https://coral-lab-asu.github.io/weaver.

Published: 2025-09-24 19:00 UTC


コメントする