STAF:大規模言語モデルを活用した自動化された攻撃ツリーベースのセキュリティテスト生成

STAF:大規模言語モデルを活用した自動化された攻撃ツリーベースのセキュリティテスト生成

なぜ重要か: 企業や社会への影響が見込まれ、一般メディアにも波及する可能性があります。

ソースを読む(export.arxiv.org)

arXiv:2509.20190v1発表タイプ:クロス

概要:現代の自動車開発において、セキュリティテストは高度化する脅威からシステムを守る上で極めて重要です。攻撃ツリーは潜在的な攻撃ベクトルを体系的に表現するために広く用いられていますが、これらのツリーから包括的なテストケースを生成することは、依然として人手と時間のかかる、エラーが発生しやすい作業であり、車両システムのテストにおいて自動化が限定的です。本論文では、セキュリティテストケース生成を自動化する新たなアプローチであるSTAF(Security Test Automation Framework)を紹介します。大規模言語モデル(LLM)と4段階の自己修正型Retrieval-Augmented Generation(RAG)フレームワークを活用することで、STAFは攻撃ツリーから実行可能なセキュリティテストケースの生成を自動化し、攻撃対象領域全体を網羅するエンドツーエンドのソリューションを提供します。特に、LLMに実際の意味のある実行可能な自動車セキュリティテストスイートを生成させるために必要な要素とプロセス、および自動テストフレームワークとの統合について示します。さらに、本アプローチを用いた汎用(バニラ)LLMとの比較、ならびに異なるLLM(具体的にはGPT-4.1とDeepSeek)の性能比較を行います。また、具体的なケーススタディにおいて、本手法の運用手順を段階的に示します。その結果、効率性、正確性、スケーラビリティ、あらゆるワークフローへの容易な統合において大幅な改善が示され、自動車セキュリティテスト方法の自動化における大きな進歩を示しています。検証テストの入力としてTARAsを使用することで、安全な自動車開発プロセスの2つの重要な要素を結びつけ、相乗効果を生み出します。

原文(英語)を表示

Title (EN): STAF: Leveraging LLMs for Automated Attack Tree-Based Security Test Generation

arXiv:2509.20190v1 Announce Type: cross
Abstract: In modern automotive development, security testing is critical for safeguarding systems against increasingly advanced threats. Attack trees are widely used to systematically represent potential attack vectors, but generating comprehensive test cases from these trees remains a labor-intensive, error-prone task that has seen limited automation in the context of testing vehicular systems. This paper introduces STAF (Security Test Automation Framework), a novel approach to automating security test case generation. Leveraging Large Language Models (LLMs) and a four-step self-corrective Retrieval-Augmented Generation (RAG) framework, STAF automates the generation of executable security test cases from attack trees, providing an end-to-end solution that encompasses the entire attack surface. We particularly show the elements and processes needed to provide an LLM to actually produce sensible and executable automotive security test suites, along with the integration with an automated testing framework. We further compare our tailored approach with general purpose (vanilla) LLMs and the performance of different LLMs (namely GPT-4.1 and DeepSeek) using our approach. We also demonstrate the method of our operation step-by-step in a concrete case study. Our results show significant improvements in efficiency, accuracy, scalability, and easy integration in any workflow, marking a substantial advancement in automating automotive security testing methodologies. Using TARAs as an input for verfication tests, we create synergies by connecting two vital elements of a secure automotive development process.

Published: 2025-09-24 19:00 UTC


コメントする