ホワイト・バジリスク:コード脆弱性検知のためのハイブリッドモデル

ホワイト・バジリスク:コード脆弱性検知のためのハイブリッドモデル

なぜ重要か: 企業や社会への影響が見込まれ、一般メディアにも波及する可能性があります。

ソースを読む(export.arxiv.org)

arXiv:2507.08540v3発表種類:置き換えクロス

要約:ソフトウェア脆弱性の増加は、サイバーセキュリティにとって大きな課題であり、より効果的な検出方法が必要とされています。本稿では、AIモデルのスケーリングにおける従来の仮説に挑戦しながら、優れた性能を示す新しい脆弱性検出アプローチであるWhite-Basiliskを紹介します。Mamba層、線形自己注意機構、およびエキスパート混合フレームワークを統合した革新的なアーキテクチャを用いることで、White-Basiliskは、パラメータ数がわずか2億個ながら、脆弱性検出タスクにおいて最先端の結果を達成します。前例のない長さのシーケンスを処理するモデルの能力により、大規模言語モデル(LLM)のコンテキスト制限を超えて、広範なコードベースを一度に包括的に分析できます。White-Basiliskは、不均衡な現実世界のデータセットにおいて堅牢な性能を示すと同時に、多様な組織規模での展開を容易にする計算効率を維持します。本研究は、コードセキュリティにおいて新たなベンチマークを確立するだけでなく、コンパクトで効率的に設計されたモデルが、特定のタスクにおいてより大規模なモデルを凌駕できるという経験的証拠を提供し、ドメイン固有のアプリケーションのためのAI開発における最適化戦略を再定義する可能性があります。

原文(英語)を表示

Title (EN): White-Basilisk: A Hybrid Model for Code Vulnerability Detection

arXiv:2507.08540v3 Announce Type: replace-cross
Abstract: The proliferation of software vulnerabilities presents a significant challenge to cybersecurity, necessitating more effective detection methodologies. We introduce White-Basilisk, a novel approach to vulnerability detection that demonstrates superior performance while challenging prevailing assumptions in AI model scaling. Utilizing an innovative architecture that integrates Mamba layers, linear self-attention, and a Mixture of Experts framework, White-Basilisk achieves state-of-the-art results in vulnerability detection tasks with a parameter count of only 200M. The model’s capacity to process sequences of unprecedented length enables comprehensive analysis of extensive codebases in a single pass, surpassing the context limitations of current Large Language Models (LLMs). White-Basilisk exhibits robust performance on imbalanced, real-world datasets, while maintaining computational efficiency that facilitates deployment across diverse organizational scales. This research not only establishes new benchmarks in code security but also provides empirical evidence that compact, efficiently designed models can outperform larger counterparts in specialized tasks, potentially redefining optimization strategies in AI development for domain-specific applications.

Published: 2025-09-24 19:00 UTC


コメントする