ソフトウェアサプライチェーンにおける自動生成コードのセキュリティへの影響調査

ソフトウェアサプライチェーンにおける自動生成コードのセキュリティへの影響調査

なぜ重要か: 企業や社会への影響が見込まれ、一般メディアにも波及する可能性があります。

ソースを読む(export.arxiv.org)

arXiv:2509.20277v1発表論文:クロス

概要:近年、様々なソフトウェアサプライチェーン(SSC)攻撃が世界的に大きなリスクとなっている。開発者がSSC攻撃に対して脆弱な危険なコードスニペットを製品に統合した場合、深刻な結果を招く可能性がある。特に、大規模言語モデル(LLM)などのコード生成技術は開発者コミュニティで広く利用されている。しかし、LLMはコード生成において、虚偽情報、誤情報、古いトレーニングデータへの依存など、固有の問題を抱えていることが知られており、これらは深刻なソフトウェアサプライチェーンの脅威につながる可能性がある。本論文では、これらの固有の問題から生じるSSCへのセキュリティ上の脅威について調査する。ソースコードにおける外部コンポーネントおよび継続的インテグレーション設定ファイルに関連する11の潜在的なSSC関連脅威を含む、3つの脅威カテゴリを検討する。LLM生成コードにおけるいくつかの脅威は、攻撃者がソフトウェアとワークフローを乗っ取ることを可能にする可能性があり、他のいくつかの脅威は、時間の経過とともにソフトウェアのセキュリティを脅かす潜在的な隠れた脅威を引き起こす可能性がある。これらのセキュリティへの影響と深刻さを理解するために、オンラインで収集されたSSC関連の質問に基づいて439,138個のプロンプトを生成するツールSSCGuardを設計し、GPTおよびLlamaの4つの一般的なLLMの応答を分析する。その結果、特定されたすべてのSSC関連の脅威が持続的に存在することが明らかになった。これらのリスクを軽減するために、虚偽情報を削減するための新しいプロンプトベースの防御機構であるChain-of-Confirmationと、ユーザーに様々なSSC脅威を知らせるミドルウェアベースの防御機構を提案する。

原文(英語)を表示

Title (EN): Investigating Security Implications of Automatically Generated Code on the Software Supply Chain

arXiv:2509.20277v1 Announce Type: cross
Abstract: In recent years, various software supply chain (SSC) attacks have posed significant risks to the global community. Severe consequences may arise if developers integrate insecure code snippets that are vulnerable to SSC attacks into their products. Particularly, code generation techniques, such as large language models (LLMs), have been widely utilized in the developer community. However, LLMs are known to suffer from inherent issues when generating code, including fabrication, misinformation, and reliance on outdated training data, all of which can result in serious software supply chain threats. In this paper, we investigate the security threats to the SSC that arise from these inherent issues. We examine three categories of threats, including eleven potential SSC-related threats, related to external components in source code, and continuous integration configuration files. We find some threats in LLM-generated code could enable attackers to hijack software and workflows, while some others might cause potential hidden threats that compromise the security of the software over time. To understand these security impacts and severity, we design a tool, SSCGuard, to generate 439,138 prompts based on SSC-related questions collected online, and analyze the responses of four popular LLMs from GPT and Llama. Our results show that all identified SSC-related threats persistently exist. To mitigate these risks, we propose a novel prompt-based defense mechanism, namely Chain-of-Confirmation, to reduce fabrication, and a middleware-based defense that informs users of various SSC threats.

Published: 2025-09-24 19:00 UTC


コメントする