SpellerSSL:P300集約を用いた自己教師あり学習によるスペラBCI

SpellerSSL:P300集約を用いた自己教師あり学習によるスペラBCI

なぜ重要か: 企業や社会への影響が見込まれ、一般メディアにも波及する可能性があります。

ソースを読む(export.arxiv.org)

arXiv:2509.19401v1発表論文:クロス

要約:脳波(EEG)を用いたP300スペラー型ブレイン・コンピュータ・インタフェース(BCI)は、低信号対雑音比(SNR)、汎化性能の低さ、そして時間のかかるキャリブレーションという3つの主要な課題に直面している。本研究では、自己教師あり学習(SSL)とP300集約を組み合わせたフレームワーク、SpellerSSLを提案する。まず、SNRを向上させるための集約戦略を導入する。次に、訓練における汎化性能を達成するために、カスタマイズされた1D U-Netバックボーンを採用し、クロスドメインとドメイン内EEGデータの両方でモデルを事前学習させる。その後、事前学習済みモデルを軽量なERP-Head分類器を用いて微調整し、P300検出を行い、学習済み表現を被験者固有のデータに適合させる。キャリブレーション時間に関する評価により、集約戦略とSSLを組み合わせることで、被験者あたりのキャリブレーション負担が大幅に軽減され、被験者間の堅牢性が向上することが示された。実験結果では、SSLはドメイン内とクロスドメインの両方で効果的なEEG表現を学習し、ドメイン内ではわずか7回の反復で94%という最先端の文字認識率と、公開II-Bデータセット上で21.86 bits/minという最高の情報伝達速度(ITR)を達成した。さらに、P300集約を用いたドメイン内SSLは、同等の文字認識率を維持しながら、必要なキャリブレーションサイズを60%削減する。本研究は、P300スペラーにSSLを適用した最初の研究であり、スペラーBCIにおける効率性と汎化性能の向上への可能性を示し、P300スペラーBCIのためのEEG基礎モデルへの道を拓くものである。

原文(英語)を表示

Title (EN): SpellerSSL: Self-Supervised Learning with P300 Aggregation for Speller BCIs

arXiv:2509.19401v1 Announce Type: cross
Abstract: Electroencephalogram (EEG)-based P300 speller brain-computer interfaces (BCIs) face three main challenges: low signal-to-noise ratio (SNR), poor generalization, and time-consuming calibration. We propose SpellerSSL, a framework that combines self-supervised learning (SSL) with P300 aggregation to address these issues. First, we introduce an aggregation strategy to enhance SNR. Second, to achieve generalization in training, we employ a customized 1D U-Net backbone and pretrain the model on both cross-domain and in-domain EEG data. The pretrained model is subsequently fine-tuned with a lightweight ERP-Head classifier for P300 detection, which adapts the learned representations to subject-specific data. Our evaluations on calibration time demonstrate that combining the aggregation strategy with SSL significantly reduces the calibration burden per subject and improves robustness across subjects. Experimental results show that SSL learns effective EEG representations in both in-domain and cross-domain, with in-domain achieving a state-of-the-art character recognition rate of 94% with only 7 repetitions and the highest information transfer rate (ITR) of 21.86 bits/min on the public II-B dataset. Moreover, in-domain SSL with P300 aggregation reduces the required calibration size by 60% while maintaining a comparable character recognition rate. To the best of our knowledge, this is the first study to apply SSL to P300 spellers, highlighting its potential to improve both efficiency and generalization in speller BCIs and paving the way toward an EEG foundation model for P300 speller BCIs.

Published: 2025-09-24 19:00 UTC


コメントする