学术论文|面向分类的脑电接口模糊粗糙特征选择

摘要

高质量的脑电图(EEG)信号分类是基于EEG的脑-机接口(BCI)技术在实际应用中的先决条件。由于脑电信号不稳定,信噪比低,且受到各种外界电磁波的污染,提取脑电信号的信息特征进行分类并不容易。一种可能的方法是集成来自不同渠道和角度的功能以获取更多信息,但更多的功能需要更多的计算时间和计算机内存。此外,其中一些函数对分类几乎没有影响。

本文采用模糊粗糙选择方法从候选特征中选择信息量最大的特征。多分类器用于根据所选特征对脑电信号进行分类。实验分析表明了该方法的有效性和有效性。

1 引言

脑机接口(BCI)为用户提供了不依赖于大脑正常的周围神经和肌肉输出通道的通信和控制通道,BCI框架由信号采集,特征提取,特征转换(也称为分类)和设备输出命令等组成,如图1所示。

目前已经开发了各种技术来采集BCI系统的输入信号,例如正电子发射断层扫描(PET),功能磁共振成像(fMRI),脑磁图(MEG)和脑电图(EEG),其中,EEG可能是开发实用BCI系统的最流行方法。

图1  BCI框架

 从分析的观点来看,脑电特征提取方法可大致分为三类,即时域,频域和时频。时域特征显示信号如何随时间变化,而频域特征显示多少信号位于一定频率范围内的每个给定频带内,相反,时频分析提供了在时间和频率上均表示的信号视图(被视为时间的函数)。

通常,使用不同的提取方法进行脑电图分析可能涉及许多特征(例如,信号频率分布,频带功率特征),受脑科学发展的限制,研究人员不一定知道特定特征的确切含义。因此,为了确保不遗漏有用的信息,天真的想法是同时使用各种功能,可以预期通过增加功能的数量,增加足够的信息进行分类的可能性也会增加。

但是,当训练数据集规模不会随着添加的更多功能而增加时,肯定不是正确的。高维特征向量可能会增加分类器发现无效模式的机会。如[8]中所述,更多的特征可能会在特征测量过程中产生更多的噪声,甚至会降低整体模型的准确性。

此外,使用更多功能意味着所需数据大小的增加,这增加了计算的复杂性。解决此问题的合理方法是减少特征的数量,以使剩余的信息丰富,这可能导致更高的未来处理性能。特征的减少不仅简化了数据集,而且保持了分类的准确性。

Pawlak [12]提出的Rough集理论是一种有效的特征缩减工具,可以保留信息内容,同时减少涉及的知识量。但是,Rough集只能处理包含离散值(名义变量)的数据集,而不能处理包含实值属性的数据集。

为了克服这一困难,Jensen和Shen [9]提出了一种Fuzzy-Rough特征选择方法,在这项研究中,使用Fuzzy-Rough法对原始特征进行预处理。为了显示Fuzzy-Rough特征选择方法的有效性,使用了几种不同的分类器来处理具有原始特征和所选特征的同一数据集。

在本文的第2节介绍了用于特征提取的技术,包括时域特征,频域特征和时频特征,第3节重点介绍了用于特征选择的Fuzzy-Rough集理论,几个分类器的处方如第4节所示,实验分析在第5节中进行了说明,以说明所提出的理论框架的有效性,最后,我们在第6节中提供结论性意见和今后的工作。

2 特征提取

提取一组合适的特征是一项挑战,因为大脑信号中的有用信息隐藏在高噪声的环境中,关于EEG信号特征提取方法的研究很多,在本节中,将回顾几种方法。

2.1原始信号数据集

图2  原始信号数据集的时间振幅图

2.2时域功能
许多EEG信号以时振幅形式记录,这是一种时域图,时域图具有很强的直觉和清晰的物理含义,因此仍得到广泛应用。例如,Srinivasan等[13]使用时域特征检测癫痫活动。时域方法主要分析和识别脑电波形特征,例如幅度,平均值,方差,偏度和峰度,有时,有必要对信号进行下采样以防止数据集过拟合,当我们将信号下采样至5.12Hz时,图2的原始时间振幅图会退化为图3。

图3 降采样至5.12Hz

2.3频域特性

与时域分析不同,频域分析指的是对数学函数或信号的频率分析,而不是时间分析,时域图可以通过傅里叶变换转换为频域图,在图中清晰地显示了脑电节律的分布和变化趋势。这些节律按频率值分为δ节律(0.5~3Hz)、θ节律(4~3Hz)、α节律(8~13Hz)、β节律(14~30Hz)和γ节律(>30Hz),2.1节中提到的原始信号数据集的频域图如图4所示。

图4 频域图

2.4时频分析 

时频分析包括使用各种时频表示同时研究时域和频域中信号的技术,时频分析不是使用处理一维信号的技术,而是使用一个域为二维实平面的函数来研究二维信号,2.1节中提到的原始信号数据集试验1的时频图如图5所示。

图5  时频图

3 Fuzzy-Rough特征选择 

已经进行了很多尝试来研究特征选择方法,例如,Amini等[1]通过SPSS软件采用逐步线性判别分析,以识别用于分类的最佳特征子集。在2009年,Jensen和Shen[9]提出了一种Fuzzy-Rough特征选择(FRFS)的方法,该方法被证明是一种非常有用的技术,通过该方法可以有效地减少离散或实值噪声数据(或两者的混合),而不需要用户提供的信息。

基于这些成功的应用,本研究采用FRFS方法来选择脑电信号中信息量最大的特征。FRFS方法基于Fuzzy集理论[20]和Rough集理论[12]的融合。Rough集方法通过特征选择(也称为属性约简)将原始信息系统简化为更简洁的版本。对于脑电信号而言,存在着难以用Rough集方法处理的噪声数据。然而,利用Fuzzy集理论可以克服这个问题。基于这一思想,将Fuzzy-Rough理论应用于特征选择[10]。

FRFS方法是在Fuzzy-Rough集理论的基础上发展起来的,通过用Fuzzy等价关系代替Rough集模型中的清晰等价关系,可以将Rough集模型生成为Fuzzy-Rough集模型。FRFS方法的主要过程简要介绍如下。设U为话语范围,X为所考虑的概念,P为某些特征。对于x,y∈U,a∈P,关于特征a(由μR a(x,y)表示),x和y之间的各种Fuzzy相似关系可以构造为如下:

其中a(x)(a(y))是目标x(y)的特征a的值,σ2 a是a的方差。使用合取算子min,将特征集P引起的模糊相似关系定义为:

与在经典Rough集理论中定义为下近似的并集的脆性正区域的构造相反,属于Fuzzy正区域的对象x∈U的隶属度仅使用由于较低的近似值包含有关对象隶属度对给定概念的确定程度的信息,因此对特征子集进行了评估。

因此:

其中P,Q是两组属性,通常,在决策理论领域中,P表示条件属性的集合,而Q表示决策属性的集合。Q对P的Fuzzy-Rough依赖度定义为:

Fuzzy-Rough约简可以定义为保留整个数据集依赖程度的特征子集,通过 a greedy hill-climbing process选择特征加入到当前最佳特征的子集中。

4 分类器

为了验证FRFS在脑电脑机接口分类中的有效性,采用支持向量机(SVM)、线性判别分析(LDA)和决策树三种分类器进行分类。

4.1 SVM分类器

使用线性决策函数的SVM被称为线性SVM,1992年,Bern-hard等人[2]提出了一种通过将内核技巧应用于最大边距超平面来创建非线性分类器的方法,由于SVM对要分类的数据规模敏感,因此有必要在训练阶段选择最有用的功能,FRFS适用于此目的。将SVM与FRFS集成在一起可以降低输入数据的维数,但保留分类功能。

4.2 LDA分类器 

LDA(也称为Fisher的LDA)的目标是使用超平面来寻求有效区分的方向。对于两类问题,特征向量的类别取决于向量在超平面的哪一侧。在LDA中,假定两个类别的数据都是正态分布的,且具有相等的协方差矩阵。通过寻找最大化两个类均值之间的距离并最小化类间方差的投影来获得分离的超平面[17]。通常,使用Fisher标准函数来获得分类矩阵W,其定义为:

其中S b和S w分别是训练数据的类间散布矩阵和类内散布矩阵,然后通过找到使规则(8)最大化的矩阵来计算最佳分类矩阵W。

4.3决策树分类器

决策树分类器方法基于选定的特征集采用具有分支和节点的树结构,决策树分类器中的关键问题是选择最有影响力的特征来确定分类,然后再选择它。

本研究采用流行的C4.5算法[15]来构建决策树,C4.5算法通过递归划分数据为给定的训练数据集生成分类决策树,决策树是使用深度优先策略来增长的。该算法考虑了可以分离数据集的所有可能的测试,并选择提供最佳信息增益的测试。

5 实验分析

在本节中,将FRFS辅助的分类器应用于一组离线EEG信号数据,所有算法均通过使用Matlab 2015a,Core i5处理器,2GHz时钟脉冲和4GB内存来实现。

5.1数据集描述

“数据集来自健康受试者,受试者被要求在皮层电位被捕获的同时在计算机屏幕上上下移动光标。在录制过程中,收到了他缓慢的皮层电势(Cz-乳突)的视觉反馈,皮质正性会导致光标在屏幕上向下移动,皮质负性会导致光标向上移动,每个审判持续6 s。在每次试验过程中,任务均通过屏幕顶部或底部的突出目标直观呈现,以指示从第二秒0.5到试验结束之间的阴性或阳性,从第二秒到第二秒5.5呈现了视觉反馈。每次试验仅提供3.5s的间隔进行培训和测试,256 Hz的采样率和3.5s的记录长度导致每次试验每个通道有896个样本。”训练样本数为268,其中135个试验属于“1”类,而133个样本属于“2”类,对应于上下移动光标,该数据集的测试次数为293,“EEG数据来自以下位置:通道1:A1-Cz(10/20系统)(A1 =左乳突),通道2:A2-Cz,通道3:2 C3的正面,通道4:C3的顶壁2厘米,通道5:C4的正面2厘米,通道6:C4的顶壁2厘米”。

5.2与使用全套原始时域功能进行比较
在BCI竞赛II中,Chung等人。在下采样到25Hz后使用时间序列,并在Ia数据集上获得了88.1%的分类精度。在本小节中,提取了522个(6ד 25×3.5”)时域特征作为原始特征。

将LDA和决策树方法应用于具有原始特征的数据集,分类准确率分别为80.1%和71.5%。对于这些原始功能,通过执行FRFS算法选择了167个功能。这些大多数选定的期货位于通道1和通道2中,这意味着与其他通道相比,来自Cz-mastoid的EEG信号包含更多信息。降维率超过68%。在执行FRFS时,基于所选特征的SVM,LDA和决策树的分类准确度分别为87.4%,79.3%和68.1%,与使用全套原始特征的同类产品的分类准确度保持接近(请参阅表1)。

总体而言,使用时域功能(完整功能或选定功能),SVM在三个分类器中表现最佳。另外,基于所选特征的计算时间显着减少。例如,与原始特征消耗的计算时间相比,SVM在选定特征上消耗的计算时间大约减少了60%。以上结果是在所有六个通道的整个数据上获得的。由于将SVM分类器用于每个通道的数据,结果如表2所示。表2显示,通道1和通道2的数据比其他通道的数据更具信息性。表1和表2提供了一种支持,即FRFS减少了冗余功能,但至少对于EEG信号的时域数据保留了分类的可靠性。

表1.原始功能和FRFS选择的功能的比较

表2.原始功能和FRFS选择的功能与SVM的比较

5.3 FRFS与IGR的比较

在本小节中,作为与FRFS的比较,提出了另一种特征选择方法,即基于信息增益的特征排名(IGR)[15],图6示出了具有不同分类器和特征的正确分类率,即分类精度。这三个图对应于具有IGR的三种不同类型的分类器,并且三个点是基于FRFS选择特征的分类精度,水平轴上的值表示通过IGR选择的特征的数量。

图6暗示所选特征的数量会显着影响分类器的性能,同时,通过使用FRFS,SVM和LDA的性能要比具有相同尺寸的IGR更好。为了更深入地观察IGR和FRFS之间的差异,我们在表3中列出了差异分类的准确性。

当FRFS辅助的分类器使用相同数量的167个特征时,其性能要优于其IGR对应的分类器。如果所选特征的数量超过370,则基于IGR的分类器可以与基于FRFS的分类器达到比较结果。因此,我们可以断言,在减少冗余特征和保留分类能力方面,FRFS方法比IGR方法表现更好。

图6 具有IGR和FRFS所选功能的分类器的性能

表3. IGR与FRFS

5.4与使用随机选择的功能进行比较

上面的讨论意味着FRFS方法可确保很少的信息丢失,但是,仍然存在一个问题,即尺寸为167的任何其他特征集是否具有相似的性能。

在不失一般性的前提下,我们随机选择了20组167个特征以测试相应的分类准确性,图7显示了针对所研究的三种类型的分类器随机选择的20个特征集的分类精度,以及具有基于FRFS的特征的分类器的正确分类率。

这些结果的进一步汇总在表4中列出,其中“最小”,“最大”和“ Ave”,代表使用随机选择的167个特征的分类器中最差,最好和平均的分类精度,表4显示,采用167个随机选择特征的分类器的平均准确度低于使用FRFS选择特征的分类器的平均准确度。基于随机选择的功能的最佳结果也低于具有FRFS选择的功能的SVM的结果。我们还发现,在所有随机选择的特征中,“最佳”随机选择的特征与FRFS选择的特征共享最多的元素,这表明FRFS方法保留了信息最多的特征。

图7 FRFS和随机选择功能的比较

表4  基于FRFS和随机选择的特征的精度

6 结论与未来工作

该研究为脑电信号分类提供了系统的框架,包括特征提取,特征选择和分类,Fuzzy-Rough特征选择(FRFS)用于减小提取特征的维数,有助于降低分类的计算复杂度。基于FRFS,可以期望诸如SVM,LDA和决策树之类的分类器在EEG信号分类方面变得更加有效。

在现实世界中,EEG信号可能包含大量特征,FRFS降低了提取特征的维数,并使分类算法可行。简而言之,这项工作使分类任务更加有效,实验分析的结果令人满意。但是,有必要测试更多的数据集并检查所提出方法的鲁棒性。此外,需要进行更深入的研究以增强基于FRFS的分类器的性能,还需要进行更深入的理论分析,以帮助扩展这项研究的适用性。

联系我们   扫描二维码

获取更多  点击添加

欢迎关注我们

BCIduino脑机接口社区

本篇由BCIduino脑机接口开源社区整理或撰写。BCIduino脑机接口社区由来自北京航空航天大学、康奈尔大学、北京大学、首都医科大学等硕博发起成立,欢迎扫码加入社群,备注”BCI”,也欢迎采购BCIduino脑电模块(某宝搜索即可)

资源下载: