1.一种基于声音诱发脑电信号的说话人识别方法,其特征在于包括以下步骤:步骤(1)、采集脑电信号
获取基线校正部分、听觉刺激部分的脑电信号;
所述的基线校正部分要求在t1时间内处于平静无任务状态,即不进行想象和听觉刺激;
所述的听觉刺激部分要求在t2时间内身体保持静止,并认真听取不同说话人的声音刺激;
步骤(2)、对步骤(1)基线校正部分脑电信号进行数据预处理,得到delta、theta、alpha、beta、high gamma五个频段基线校正部分脑电信号;其中数据预处理包括降采样、滤波;
步骤(3)、对步骤(1)听觉刺激部分脑电信号进行数据预处理,得到delta、theta、alpha、beta、high gamma五个频段的多个听觉刺激部分脑电信号样本;其中数据预处理包括降采样、滤波、去伪迹、样本切分;
步骤(4)、听觉刺激部分脑电信号的特征提取
4.1获取步骤(3)每个脑电信号样本的时域统计特征
4.2获取步骤(3)每个脑电信号样本的时频特征
4.3将步骤4.1得到的时域统计特征和步骤4.2得到的时频特征拼接在一起,获取融合特征;
步骤(5)、插值法减弱背景噪声
采用alpha频段基线校正部分脑电信号数据经过步骤(4)的特征提取后,得到融合特征,作为背景模板;
对步骤(4)处理后的5个频段样本的融合特征减去背景模板,得到干净任务态数据融合特征;
步骤(6)、通道选择
对干净任务态数据融合特征的所有脑电通道使用FCSI(Fisher’s class separabilityindex)通道选择算法进行处理,在F区、FC区、C区、T区、CP区、P区脑区通道中各自选取FCSI值前n个的融合特征,1≤n≤9;同时将上述融合特征的对应说话人作为标签,构建训练集;
步骤(7)、利用上述训练集对分类器训练
分类器由二维卷积网络、时域卷积网络、Flatten层、全连接层构成;以步骤(6)处理后融合特征为输入,说话人分类结果为输出;
二维卷积网络的输入为步骤(6)处理后融合特征,由两个串联的卷积块构成;每个卷积块由二维卷积单元、最大池化层串联构成;
时域卷积网络的输入为二维卷积网络的输出,由两个串联的残差块构成;每个残差块由两个串联的一维卷积单元、一个恒等映射构成;
步骤(8)、利用训练好的分类器进行声音分类并进而识别出说话人。
2.根据权利要求1所述的一种基于声音诱发脑电信号的说话人识别方法,其特征在于步骤(2)、(3)所述降采样是将步骤(1)基线校正部分、听觉刺激部分原始脑电信号降采样到
250Hz。
3.根据权利要求1所述的一种基于声音诱发脑电信号的说话人识别方法,其特征在于步骤(2)、(3)所述滤波是将降采样后的基线校正部分、听觉刺激部分脑电信号分为delta、theta、alpha、beta、high gamma五个频段。
4.根据权利要求1所述的一种基于声音诱发脑电信号的说话人识别方法,其特征在于步骤(3)所述去伪迹是利用工具箱eeglab上的run ica函数,根据独立成分分析方法去除听觉刺激部分5个频段脑电信号中伪迹。
5.根据权利要求1所述的一种基于声音诱发脑电信号的说话人识别方法,其特征在于步骤(3)所述样本切分是对去伪迹后的听觉刺激部分脑电信号进行样本切分,获得相同时长的多个样本。
6.根据权利要求5所述的一种基于声音诱发脑电信号的说话人识别方法,其特征在于计算步骤(3)每个脑电信号样本所有采样点的最大值、最小值、方差、标准差、均值、面积和信息熵,将这7个值作为时域统计特征。
7.根据权利要求6所述的一种基于声音诱发脑电信号的说话人识别方法,其特征在于对步骤(3)每个脑电信号样本做短时傅里叶变换,将信号从时域变换到时频域,得到时频特征。
8.根据权利要求6所述的一种基于声音诱发脑电信号的说话人识别方法,其特征在于脑电信号的通道数为32个。
9.一种电子设备,其特征在于,包括处理器和存储器,所述存储器存储有能够被所述处理器执行的机器可执行指令,所述处理器执行所述机器可执行指令以实现权利要求1‑8任一项所述的方法。