SteinerSQL:テキストからSQL生成のためのグラフ誘導数理推論

SteinerSQL:テキストからSQL生成のためのグラフ誘導数理推論

なぜ重要か: 企業や社会への影響が見込まれ、一般メディアにも波及する可能性があります。

ソースを読む(export.arxiv.org)

arXiv:2509.19623v1 発表種別:新規

概要:大規模言語モデル(LLM)は、高度な数学的推論と複雑なスキーマナビゲーションの両方を必要とする複雑なText-to-SQLクエリに苦労している。既存の手法はこれらの課題を個別に解決することが多く、論理的および構造的な正確性を損なう断片的な推論プロセスを生み出している。これを解決するために、我々はこれらの2つの課題を単一のグラフ中心の最適化問題に統合するフレームワーク、SteinerSQLを導入する。SteinerSQLは、必要なテーブル(端末)を特定するための数学的分解、Steiner木問題による最適な推論足場構築、および正確性を確保するための多段階検証という3段階で動作する。挑戦的なLogicCatとSpider2.0-Liteベンチマークにおいて、SteinerSQLはGemini-2.5-Proを用いて、それぞれ36.10%と40.04%の実行精度という新たな最先端技術を確立した。精度に加えて、SteinerSQLはText-to-SQLのための新しい統一されたパラダイムを示し、より堅牢で原理に基づいた複雑な推論タスクへの解決策への道を拓く。

原文(英語)を表示

Title (EN): SteinerSQL: Graph-Guided Mathematical Reasoning for Text-to-SQL Generation

arXiv:2509.19623v1 Announce Type: new
Abstract: Large Language Models (LLMs) struggle with complex Text-to-SQL queries that demand both sophisticated mathematical reasoning and intricate schema navigation. Existing methods often tackle these challenges in isolation, creating a fractured reasoning process that compromises logical and structural correctness. To resolve this, we introduce SteinerSQL, a framework that unifies these dual challenges into a single, graph-centric optimization problem. SteinerSQL operates in three stages: mathematical decomposition to identify required tables (terminals), optimal reasoning scaffold construction via a Steiner tree problem, and multi-level validation to ensure correctness. On the challenging LogicCat and Spider2.0-Lite benchmarks, SteinerSQL establishes a new state-of-the-art with 36.10% and 40.04% execution accuracy, respectively, using Gemini-2.5-Pro. Beyond accuracy, SteinerSQL presents a new, unified paradigm for Text-to-SQL, paving the way for more robust and principled solutions to complex reasoning tasks.

Published: 2025-09-24 19:00 UTC


コメントする