1.基于Fbank特征和MFCC特征融合的声纹识别方法,其特征在于,具体包括以下步骤:步骤一、准备语音数据集,并对数据集进行预处理;
步骤二、提取Fbank特征;
将预处理后的语音帧序列经过快速傅里叶变换、取功率谱、取幅度平方、经过梅尔滤波器组并取对数得到Fbank特征;
步骤三、提取MFCC特征;
在Fbank特征的基础上进行离散余弦变换得到MFCC特征;
步骤四、特征融合;
在得到40维Fbank特征和12维MFCC特征的基础上进行特征融合,将第1‑12组的MFCC特征嵌入到40维Fbank的第1‑12组中。
2.根据权利要求1所述的基于Fbank特征和MFCC特征融合的声纹识别方法,其特征在于:所述的梅尔滤波器组系数取40。
3.根据权利要求1所述的基于Fbank特征和MFCC特征融合的声纹识别方法,其特征在于:所述的在Fbank特征的基础上进行离散余弦变换得到MFCC特征,具体为:提取第1‑12组系数进行DCT变换得到12维的MFCC特征。
4.根据权利要求1所述的基于Fbank特征和MFCC特征融合的声纹识别方法,其特征在于:所述的对数据集进行预处理具体为:预加重、分帧、加窗,最后输出语音帧序列。
5.根据权利要求4所述的基于Fbank特征和MFCC特征融合的声纹识别方法,其特征在于:所述的分帧采用25ms帧长、10ms帧移。
6.根据权利要求4所述的基于Fbank特征和MFCC特征融合的声纹识别方法,其特征在于:所述的加窗的窗口选择为汉明窗。