如是我闻,姑妄听之!
—— ——题记
前言
在基于传统机器学习的运动想象分类算法中,CSP是是最常用的一种用来提取特征的算法,后来出现的SBCSP(Sub-bank CSP),FBCSP(Filter bank CSP)等都是在CSP的基础上进行改进的算法,这里主要是整理一些我自己在学习CSP算法时的理解。
为什么使用CSP
下面是一张从BCI比赛的数据集介绍中粘过来的一张介绍脑电信号采集时电极分布的示意图,从图中可以看出,表面上每个电极采集到的分别是不同区域的EEG信号,但是由于脑电信号的空间传播,每个电极实际采集到的信号是不同区域信号混叠之后的结果。而对脑电信号进行空间滤波则是希望找到电极与电极之间的关系,将电极中一些对分类有用的成分进行放大,而将一些公有的噪声信息(比如散布多个电极中的一些伪影)进行消除。而CSP方法的本质就是利用不同运动现象任务在电极上的方差分布的差异来提取特征。
空间滤波器的选择
我们使用\(X_i\in R^{(C\times S)},i=1,2,⋯,N\)来表示包含两种运动想象任务 \(\{ C_+,C_- \}\)的N个脑电信号,其中\(C\)代表的采集脑电信号时电极的个数,\(S\) 代表任务的采样点的个数。而CSP算法的目的是为了找到一个映射矩阵 \(W \in R^{(C×C)}\)将原始的脑电信号映射到一个代理空间中得到 \(X_{csp} =WX\),其中映射矩阵\(W = (w_1^T,w_2^T,⋯,w_C^T)\)的每个行向量\(w_*^T\)都可以看作是一个空间滤波器。下面需要考虑的是怎么寻找到可以使脑电信号更易于区分的空间滤波器。
首先,CSP假设在代理空间中不同电极采集到的脑电信号是互不相关的,即每个脑电信号的空间协方差矩阵\(\Sigma _{csp} = X_{csp}X_{csp}^T=(WX)(WX)^T=W(XX^T)W^T=W\Sigma W^T\)应该是一个对角矩阵,也就是\(W\)需要满足\(W\bar{\Sigma}W^T=\Lambda\),其中 \(\bar{\Sigma}=\frac{1}{N}\sum_{i = 1}^N \frac{X_i X_i^T}{trace(X_i X_i^T)}\) 代表的是协方差矩阵的估计量(注意:其中 \(trace(XX^T)\) 是为了进行归一化,为了理解方便,后面省略了归一化的操作,另外在计算脑电信号的协方差矩阵时通常认为脑电信号的均值为0)。
为了使脑电信号更具有可区分性,通常还要考虑脑电信号的条件分布(即在每个类别下进行分析)。分别使用两个类别的数据\(X_+\)和\(X_-\)计算协方差矩阵\(Σ_+\),\(Σ_-\):
此时我们需要获得满足以下条件的映射矩阵:
那么到底该怎么具体地对映射矩阵进行求解呢?目前我了解到的求解的方法有以下三种:
- 在[1]通过计算\(\Sigma_+\)和\(\Sigma_-\)的广义特征值来求解:
此时得到的广义特征向量和广义特征值满足:
其中,\(λ\)是一个重要的值,它表示了正类和负类的差异。通常为了获得更具有可区分性的特征,我们希望\(λ_+\)和\(λ_-\)的差异越大越好,因此在求出所有的广义特征值\(λ\)后首先根据大小进行排序,然后选择最大的和最小的\(2m\)个广义特征值所对应的广义特征向量来作为最后的空间滤波器。
- 类似于第一种方法,在[2]中通过计算\(Σ_+\)和\(Σ_-+Σ_+\)的广义特征值来求解:
- 第三种方法在早期的论文中出现的较多一点,这种方法可以参考[3]这篇论文。
现在我们已经求出映射矩阵\(W\),并选取\(2m\)个行向量作为最终的空间滤波器,最后我们得到了用于分类的特征向量:
其中\(Var(*)\)代表的是方差操作,使用\(Log(*)\)是为了让特征近似于正太分布。
总结
CSP算法是运动想象中最经典的传统特征提取方法之一,高效,简便以及可解释是其最大的优势。其不足点是,每次使用CSP算法只能考虑两个类别的脑电信号,因此在进行多分类问题时,需要使用one-vs-rest或者one-vs-one来进行多次CSP提取特征。
引用
[1] B. Blankertz, R. Tomioka, S. Lemm, M. Kawanabe and K. Muller, "Optimizing Spatial filters for Robust EEG Single-Trial Analysis," in IEEE Signal Processing Magazine, vol. 25, no. 1, pp. 41-56, 2008, doi: 10.1109/MSP.2008.4408441.
[2] Keng A K , Yang C Z , Chuanchu W , et al. Filter Bank Common Spatial Pattern Algorithm on BCI Competition IV Datasets 2a and 2b[J]. Frontiers in Neuroscience, 2012, 6:39.
[3] Ramoser H , Muller-Gerking J . Optimal spatial filtering of single trial EEG during imagined hand movement[J]. IEEE Transactions on Rehabilitation Engineering, 2000, 8:441--446.