1.一种声纹识别中录音回放攻击检测的声学特征提取方法,其特征在于,包括以下步骤:S10、对输入语音进行预处理;
S20、对经过预处理的每一帧语音信号进行傅里叶变换,将时域信号转换为频域信号,得到语音信号的频谱;
S30、计算傅里叶变换后的每一帧语音信号的谱线能量;
S40、根据谱线能量对每一帧语音信号进行非对称双曲正弦频率尺度变换滤波;
S50、对滤波后的每一帧语音信号进行对数变换,得到每一帧语音信号的对数能量谱;
S60、对每一帧语音信号的对数能量谱进行离散余弦变换,得到每一帧语音信号的双曲正弦倒谱系数。
2.如权利要求1所述的声纹识别中录音回放攻击检测的声学特征提取方法,其特征在于,所述步骤S10中的预处理包括分帧、加窗和去噪。
3.如权利要求2所述的声纹识别中录音回放攻击检测的声学特征提取方法,其特征在于,所述步骤S10具体包括:S11、对输入语音信号x(n)进行分帧,将语音信号分割成帧长为N的多个语音帧,相邻两帧之间有重叠,帧移为L;
S12、对分帧后的每一帧语音信号x(i,n)加窗,用窗长为N的汉明窗乘每一帧语音信号,得到加窗后的语音帧xw(i,n), 计算公式如下:S13、计算每一帧的短时能量SE(i,将SE(i)小于一定阈值θSE的帧作为背景噪声消除,得到消除背景噪声之后的纯输入语音信号,计算公式如下二
4.如权利要求3所述的声纹识别中录音回放攻击检测的声学特征提取方法,其特征在于,所述阈值θSE根据应用场合的背景噪声短时能量平均值的二倍设置。
5.如权利要求1所述的声纹识别中录音回放攻击检测的声学特征提取方法,其特征在于,所述步骤S20具体包括:根据离散傅里叶变换公式,采用快速傅里叶变换算法对经过预处理的每一帧语音信号进行傅里叶变换,将时域信号转换为频域信号Xw(i,k), 傅里叶变换公式如下:其中,k表示频域中的第k条谱线。
6.如权利要求1所述的声纹识别中录音回放攻击检测的声学特征提取方法,其特征在于,所述步骤S40具体包括:步骤S41、使用非对称双曲正弦频率尺度变换公式计算实际频率分布范围对应的双曲正弦频率尺度分布范围,在新的双曲正弦频率尺度分布范围内配置多个满足相邻滤波器中心频率与边界频率之间关系的等宽三角形滤波器;
步骤S42、通过非对称双曲正弦频率尺度变换公式的逆变换,计算双曲正弦频率尺度分布范围内等间隔分布的三角形滤波器组对应的原始频率尺度三角形滤波器组,得到原始频率尺度上每个三角形滤波器的中心频率值与边界频率值,得到每个滤波器的幅频响应;
步骤S43、根据每个滤波器的幅频响应计算每一帧语音信号谱线能量通过非对称双曲正弦频率尺度变换滤波器的输出值。
7.如权利要求6所述的声纹识别中录音回放攻击检测的声学特征提取方法,其特征在于,所述非对称双曲正弦频率尺度变换公式为:其中,f是原始频率,Fsinh是双曲正弦频率,两个指数项参数0.0011和0.001分别用来控制高频段和低频段的非对称变换,参数3750控制变换的中心频率。
8.如权利要求7所述的声纹识别中录音回放攻击检测的声学特征提取方法,其特征在于,所述相邻滤波器中心频率与边界频率之间关系具体包括:fc(l)=flo(l+1)=fhi(l-1),l=1~Lflo(1)=0
fhi(L)=Fsinh(fs/2)
其中,fc(l)表示第l个滤波器的中心频率,fs表示采样频率,flo(l)表示第l个滤波器的低频边界频率,fhi(l)表示第l个滤波器的高频边界频率,L表示滤波器个数。
9.如权利要求8所述的声纹识别中录音回放攻击检测的声学特征提取方法,其特征在于,所述步骤S43具体包括:在频域中将每一帧语音信号能量谱Ew(i,k), 与第l个非对称双曲正弦频率尺度变换滤波器幅频响应在对应频率点相乘然后相加得到其输出值Sw(i,l),计算公式如下:
10.如权利要求9所述的声纹识别中录音回放攻击检测的声学特征提取方法,其特征在于,所述步骤60中离散余弦变换的公式为: