基于EEG信号的生物识别系统影响因素分析

摘要：由于指纹、语音或面部等传统特征极易被伪造，因此寻找新的生物特征成为当务之急。对生物电信号的研究也因此具有了开发新的生物识别系统的潜力。使用脑电信号是因为其因人而异，并且相比传统的生物识别技术更难复制。这项研究的目的是基于脑电信号分析影响生物识别系统性能的因素。此项研究使用了六个不同的分类器来对比研究离散小波变换的几种分解级别作为一种预处理技术，同时还探讨了记录时间的重要性。这些分类器是高斯朴素贝叶斯分类器，K近邻算法（KNN），随机森林，AdaBoost(AB)，支持向量机（SVM）和多层感知器。这项工作证明了分解程度对系统的整体结果没有很大的影响。另一方面，脑电图的记录时间对分类器的性能有较大影响。值得说的是这项研究使用了两组不同的数据集来验证结果。最后，我们的实验表明，SVM和AB是针对此特定问题的最佳分类器，它们分别实现了85.94±1.8，99.55±0.06，99.12±0.11和95.54±0.53，99.91±0.01和99.83±0.02的灵敏度、特异性和准确率。

1.介绍

随着科技的飞速发展，生物识别系统出现在许多日常场景中以提供数据的安全性。当今时代，大多数智能手机至少有一个嵌入式生物识别系统，通常是指纹或面部识别。除此之外，在需要更严格的安全保障时，可以选择生物识别系统来保护重要的数据。例如，银行可以使用它们来对其客户的账户提供安全访问。许多类型的生物学特性可以用来开发生物识别系统。但是其中的许多生物学特性容易受到暴力攻击、伪造或直接强迫用户的影响。除此之外，大多数生物识别系统始终存在的问题是它们无法保证用户还活着。为了克服这些问题，脑电图信号是作为生物特征的最佳选择，将脑电信号作为生物识别技术的主要优势包括：

普遍性：所有人类大脑都有神经元，这些神经元产生电活动，可以以EEG信号的方式读取。任何年龄和任何精神状态（包括植物状态或昏迷）的人都会产生这些信号。

独特性：基于脑电的人体识别研究表明，脑电信号在不同的人之间有足够的差异，可以对他们进行分类。

永久性：一些验证脑电图随时间变化的研究表明，脑电信号在开发生物识别系统方面保持了很大程度的可重复性。

规避性：传统生物识别技术最关键的问题之一，是无需征得用户的同意就可以收集特征。而没有一种技术可以远程记录脑电波。此外，通过强迫用户进行EEG录制而产生的负面情绪会导致身份验证失败。

尽管EEG信号有许多优点，但基于它们开发生物识别系统仍具有挑战性。在对这些信号进行处理之前，需要对其进行预处理，因为它们包含频带和人们头部的各个层面产生的混合信号。经过预处理之后，可以正确提取正在进行的EEG中的各个独立特征。最新技术提出了可以从这些信号中获得的大量功能，以及可以用于此任务的许多分类算法。但是对于进行生物识别，没有标准的记录时间。

本文的研究旨在提供对离散小波变换（DWT）作为预处理和特征提取技术的详细分析。此外，本文还研究了记录时间对分类器和DWT性能的影响。除此之外，本研究旨在建立不同分类算法之间的比较，以选择最适合开发此类系统的算法。本文的主要贡献是分析了基于EEG的生物识别系统开发中所需的一些基本组件，此分析将增进对可能影响系统性能的因素的理解。

2. 方法

2.1 数据说明

本研究中使用的EEG信号对应于两个不同的数据集。第一个是开放获取的DEAP数据集，第二个是BIOMEX-DB，这是一个私人数据集，记录在INAOE中。使用两个不同的数据集的目标是验证不同数据源的结果。

DEAP数据集包含32名健康参与者(50%是女性)的脑电图，年龄在19岁到37岁(平均年龄27岁)之间，记录了他们对40个视频（每个视频一分钟）所做出的反应。采用这个数据集的目的是分析人类的情感状态，出于这个原因，在每段视频之后，参与者都会对他们的效价、唤醒能力、优势和喜好进行评级。每个记录有32个EEG通道、12个外围通道、3个未使用通道和1个状态通道。此外，在这项工作中，实验使用了该数据集的预处理版本。该方案对512 Hz至128 Hz的信号进行下采样，采用盲源分离技术去除眼电伪影，并采用4-45 Hz的带通滤波器。

另一方面，BIOMEX-DB数据集的目的是开发不同形式的生物识别系统。这项工作使用了数据集的脑电图部分，由51名健康参与者(49%女性)组成，年龄在16岁到61岁(平均年龄29岁)之间。对每个参与者进行135段2.5秒的录音，每段录音都是1到10个数字的发音。此外，每个EEG有14个通道的信息，频率为2048 Hz，但它被下采样到128 Hz。

2.2 预处理

虽然这项工作中使用的DEAP数据集版本已经进行了预处理，但在这两个数据集中，都应用了离散小波变换。如前所述，由于其非平稳特性，该技术在脑电信号分析中特别有用。此外，这种变换具有揭示与EEG信号相关的特征的优点，而这些特征对于其他技术来说并不明显。小波分析包括将EEG信号表示为一组特定小波的线性组合。这些小波是一个被称为母小波的主函数平移和扩张的结果。许多小波都可以作为母小波，但Daubechies-4(DB4)在处理脑电图时应用较多，因为它的平滑特性可以检测这些信号中的变化。本文比较了四种不同的分解层次，分析了它们对系统性能的影响。首先，进行五级分解，得到以下频段：32-64Hz ; 16-32Hz; 8-16Hz; 4-8Hz; 2-4Hz以及＜2HZ(A5)。这些频带对应于与特定功能相关的五个主要大脑节律。图1显示了一个五级DWT。第二种离散小波变换具有四个层次的分解，因为许多作者提出它是为了减少数据量。此外，还应用了三级和两级分解来分析它们对生物识别系统的影响。

图1. 具有5层分解的离散小波变换

2.3 特征提取

提取的近似系数和细节系数是EEG信号在时间和频率上的能量分布的紧凑表示。即使这些系数可以用作特征向量，也有更紧凑的特征可以表征原始信号。Hamad等人提出了使用DWT系数计算的10个特征，但本研究仅使用相对小波能量(RWE)，因为该特征已被证明在其他脑电信号应用中是有用的。分类这项研究在识别问题上遵循封闭集策略，这意味着在训练时分类器看到了所有测试类的示例。此外，还采用了多类分类方法，其中对于每个数据集，分类类别的数量等于受试者的数量。对6种不同的分类算法进行了评价，对它们进行了比较，选择了最适合这一特定问题和数据集的分类算法。之所以选择这些分类器，是因为每个分类器都基于不同的标准来执行分类。分类器包括：支持向量机(Support Vector Machine，简称SVM)、K-近邻(KNN)、随机森林算法、高斯朴素贝叶斯(GNB)、AdaBoost(AB) 和多层感知器(MLP)。

2.3.1 超参数优化

为了选择每个分类器的超参数，采用贪婪搜索优化方法。对学习算法的超参数空间的手动指定子集进行穷举搜索是该优化的基础。在这项工作中，十次交叉验证被用来指导贪婪优化的性能。每个数据集的超参数优化都是独立进行的，但两个数据集的超参数子集是相同的。此外，在每个数据集中，随机选择每个受试者20%的可用数据来执行这一步骤。为了避免这一过程影响实验结果，在后续阶段不使用该数据。表1包含在贪婪搜索优化过程中测试的一组值；第一列显示分类器名称，第二列显示超参数的名称，最后一列显示可能的值。表2中列出了为每个数据集和分解级别找到的最佳超参数值，其中括号中的是分解级别2、3、4或5，星号表示所有分解级别使用相同的值。

表2. 使用DEAP和BIOMEX-DB数据集为每个分类器和分解级别选择最佳超参数(在括号中)，(*)表示为所有分解级别选择相同的值。

2.4 性能度量和实验验证

平均准确率(ACC)、宏观平均敏感度(Se)和宏观平均特异度(Sp)被用来衡量分类算法在这种多类场景中的性能。为了提高实验结果的可靠性，本研究采用了十倍交叉验证的方法。在这两个数据集中，实验使用了80%的可用数据，因为超参数优化过程使用了剩余的20%。通过随机选择每个受试者75%的信号用于训练和25%用于测试来执行数据集的训练-测试分割。这种拆分数据集的方式保证了在培训和测试阶段使用每个参与者的相同数量的信息。此外，每个文件夹中包含的信息对于所有分类算法都是相同的；图2说明了这个验证过程。

图2. 验证进程表示形式

此外，为了验证每个分类器获得的结果是否显著不同，使用了两种多变量技术。Hotelling的T2检验允许比较两种算法，而对于两种以上算法的比较，则采用多变量方差分析(MANOVA)。Yıldız等人的结果表明，多变量检验比单变量误差检验具有更高的说服力；也就是说，它们可以检测出误差检验所不能检测到的差异。

2.5 实验说明

实验的目的是评估脑电记录的持续时间和离散小波变换的分解程度对分类器性能的影响。在这两个数据集中，每个信号被分割成以下时间：0.25、0.5、0.75、1、1.25、1.5、1.75、2、2.25和2.5s。为了模拟真实场景中记录之间可能存在的差异，随机开始分割。图3显示了实验的一般流程图。

图3. 实验流程图，用于评估脑电记录的持续时间和分解程度对性能的影响

3.实验结果

本研究中使用的两个数据集的结果和分析分别给出。图4显示了使用DEAP数据集的每个DWT级别中的所有分类器实现的敏感度；它仅基于敏感度，因为这是最低的性能度量。此外，特异性和准确性行为与敏感性行为相同。此图说明了DWT分解级别和分类器之间的依赖关系。例如，KNN、RF、AB和MLP倾向于使用两个级别的分解来获得更好的结果，而GNB和SVM则倾向于使用三个级别的分解。

图4. 基于DEAP数据集的按DWT分解级别分组的分类器敏感度盒图

另外，图4显示系统的性能与脑电记录时间高度相关。然而，应用Hotelling的T2检验来验证每个时间段之间在最大使用时间方面是否存在显著差异，即2.5s。在该测试中使用了每个时间段中分类器的灵敏度、特异性和准确性。值得一提的是，此分析应用在分解的每个级别；表3是这些测试的结果。此表显示，当使用两级和五级分解时，从1.75s的记录开始，分类器的性能不再有显著差异。另一方面，经过三层分解后，这一时间缩短到1.5s。最后，使用四层离散小波变换时，时间增加到2s。

表3. 在每个时间段的结果和使用DEAP数据集记录的2.5s之间的Hotelling T2测试检验的结果p值，粗体值是大于0.05的p值。

我们使用MANOVA验证了表3的结果。在此测试中，p值小于或等于0.05表示比较值之间的显著差异。在两级分解的情况下，得到的p值为0.21(>0.05)，验证了从1.75s的记录开始，系统的性能没有显著变化。同样的情况也发生在五级分解的情况下，其中p值为0.19。另一方面，当将MANOVA应用于三个水平的分解结果时，得到的p值为0.05(≤0.0 5)。因此，仅使用从1.75s开始而不是从1.5s开始获得的结果进行相同的分析，结果p值为0.14。最后，对于四个水平的分解，比较两秒记录的结果得到的p值为0.32。总的来说，使用该数据集的最佳分类器是支持向量机，因为在记录时间为1.75s，分解为3个水平时，其灵敏度、特异度和准确率分别为85.94±1.8、99.55±0.06和99.12±0.11。另一方面，使用相同的数据，GNB分类器的敏感性、特异性和准确性最差，分别为47.97±2.26、98.32±0.07、96.75±0.14。这些结果可能是因为该分类器假设输入独立。但是，在这个实验中，条目高度相关。表4显示了仅使用三个分解级别的详细分类结果，因为它是最好的级别。此外，图5给出了使用最佳分解级别和1.75s记录的每个分类器的混淆矩阵。

表4. 使用DWT和DEAP数据集的三个级别的分类结果

图5. 使用三层分解、1.75s记录和DEAP数据集的分类器混淆矩阵

对于BIOMEX-DB数据集，图6显示了每个DWT级别的分类器所实现的灵敏度。结果表明离散小波变换的分解程度对分类器的性能没有显著影响。因此，对来自所有时间段中关于分解级别的所有分类器的数据应用MANOVA。得到的p值为0.1，说明不同分解级别之间的性能差异不显著。此外，在不考虑对应于两级DWT的数据的情况下执行相同的分析，同时p值增加到0.85。此外，与DEAP的情况一样，应用Hotelling的T2检验来验证每个时间段和最大使用时间之间是否存在显著差异。表5的内容为测试的结果。该表表明，当使用三级和五级分解时，从1.5s的记录开始，分类器的性能不再有显著差异。然而由于p值接近0.0 5，在随后的分析中只使用了1.75s记录的结果。对每个级别的分解使用MANOVA来验证该表的结果。两级、三级、四级和五级分解的p值分别为0.11、0.17、0.19和0.28，说明在记录1.75s的脑电信号后，分类器的性能没有显著差异。

在这种情况下，采用3个分解水平、记录1.75s的最佳分类器为AB，其灵敏度、特异性和准确性分别为95.54±0.53、99.91±0.01和99.83±0.02。但是，应用MANOVA来验证AB和RF实现的性能之间是否存在显著差异时，分析得到的p值为0.99，这一结果表明AB和RF的性能几乎相同，这是可以理解的，因为AB的弱分类器是RF。在图6中，还可以看到SVM和MLP是最不稳定的分类器，因为它们的方差很高。使用三个分解级别的详细分类结果可以在表6中看到。最后，图7显示了使用最佳分解级别和1.75s记录的每个分类器的混淆矩阵。

表6. 使用DWT和BIOMEX-DB的三个级别的分类结果

图6. 使用BIOMEX-DB数据集绘制的按DWT分解级别分组的分类器敏感度的盒图

图7. 使用三层分解、1.75s记录和BIOMEX-DB的分类器混淆矩阵

4.结论和未来工作

本文提出了一个基于脑电信号分析的生物识别系统，系统的每个部分都使用了一种在最先进的范围中极力推荐的技术。为此，采用离散小波变换(DWT)作为预处理方法，提取相对小波能量作为特征，对6种不同的人工智能模型进行测试，从中选出最优的模型。作为下一步的工作，需要对脑电信号通道进行分析。对通道的研究可以通过只选择提供有价值信息的通道来减少系统必须处理的数据量。同时，它还可以提高该类型系统的可移植性。此外，还应按研究对象进行分析，以进一步调查可能影响实现良好用户识别所需的脑电记录时间的因素。另外，由于深度学习的快速发展，需要对这些类型的神经网络进行测试，以便进行更全面的比较。在这项工作中，只研究了基于脑电信号的单峰生物识别系统的开发。因此，研究使用经典信号(如语音、人脸或指纹)和生物电信号(如心电图)的多模式系统的开发，以分析这如何减少EEG记录所需的时间并提高系统的安全性将有重大的研究意义。