ARCADE:多様なデータモダリティを横断するハイブリッドおよび連続クエリ処理のためのリアルタイムデータシステム
なぜ重要か: 企業や社会への影響が見込まれ、一般メディアにも波及する可能性があります。
arXiv:2509.19757v1発表タイプ:クロス
概要:テキスト、画像、ビデオ、空間、関係などの多様なモーダルにまたがるマルチモーダルデータの爆発的な増加と、これらのデータに対するリアルタイム意味検索・検索の必要性により、既存のマルチモーダルおよびリアルタイムデータベースシステムは、効率的な取り込みと継続的なクエリ機能を欠いているか、表現力豊かなハイブリッド分析をサポートできていないかのいずれかとなっています。本稿では、多様なデータタイプにわたる高スループットな取り込みと、表現力豊かなハイブリッドおよび継続的なクエリ処理を効率的にサポートするリアルタイムデータシステム、ARCADEを紹介します。ARCADEは、ベクトル、空間、テキストデータモーダルに対するLSMベースのストレージ上の統一されたディスクベースの二次インデックス、ハイブリッドクエリのための包括的なコストベースのクエリオプティマイザ、および効率的な継続的なクエリのための増分マテリアライズドビューフレームワークを導入しています。オープンソースのRocksDBストレージとMySQLクエリエンジンを基盤とするARCADEは、リードヘビーなワークロードで最大7.4倍、ライトヘビーなワークロードで最大1.4倍、主要なマルチモーダルデータシステムを凌駕します。
原文(英語)を表示
Title (EN): ARCADE: A Real-Time Data System for Hybrid and Continuous Query Processing across Diverse Data Modalities
arXiv:2509.19757v1 Announce Type: cross
Abstract: The explosive growth of multimodal data – spanning text, image, video, spatial, and relational modalities, coupled with the need for real-time semantic search and retrieval over these data – has outpaced the capabilities of existing multimodal and real-time database systems, which either lack efficient ingestion and continuous query capability, or fall short in supporting expressive hybrid analytics. We introduce ARCADE, a real-time data system that efficiently supports high-throughput ingestion and expressive hybrid and continuous query processing across diverse data types. ARCADE introduces unified disk-based secondary index on LSM-based storage for vector, spatial, and text data modalities, a comprehensive cost-based query optimizer for hybrid queries, and an incremental materialized view framework for efficient continuous queries. Built on open-source RocksDB storage and MySQL query engine, ARCADE outperforms leading multimodal data systems by up to 7.4x on read-heavy and 1.4x on write-heavy workloads.
Published: 2025-09-24 19:00 UTC