欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2021105861346
申请人: 杭州电子科技大学
专利类型:发明专利
专利状态:已下证
专利领域: 乐器;声学
更新日期:2024-01-05
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.基于Fbank特征和MFCC特征融合的声纹识别方法,其特征在于,具体包括以下步骤:步骤一、准备语音数据集,并对数据集进行预处理;

步骤二、提取Fbank特征;

将预处理后的语音帧序列经过快速傅里叶变换、取功率谱、取幅度平方、经过梅尔滤波器组并取对数得到Fbank特征;

步骤三、提取MFCC特征;

在Fbank特征的基础上进行离散余弦变换得到MFCC特征;

步骤四、特征融合;

在得到40维Fbank特征和12维MFCC特征的基础上进行特征融合。

2.根据权利要求1所述的基于Fbank特征和MFCC特征融合的声纹识别方法,其特征在于:所述的梅尔滤波器组系数取40。

3.根据权利要求1所述的基于Fbank特征和MFCC特征融合的声纹识别方法,其特征在于:所述的在Fbank特征的基础上进行离散余弦变换得到MFCC特征,具体为:提取第1‑12组系数进行DCT变换得到12维的MFCC特征。

4.根据权利要求1所述的基于Fbank特征和MFCC特征融合的声纹识别方法,其特征在于:所述的在得到40维Fbank特征和12维MFCC特征的基础上进行特征融合,具体为:将第1‑

12组的MFCC特征嵌入到40维Fbank的第1‑12组中。

5.根据权利要求1所述的基于Fbank特征和MFCC特征融合的声纹识别方法,其特征在于:所述的对数据集进行预处理具体为:预加重、分帧、加窗,最后输出语音帧序列。

6.根据权利要求5所述的基于Fbank特征和MFCC特征融合的声纹识别方法,其特征在于:所述的分帧采用25ms帧长、10ms帧移。

7.根据权利要求5所述的基于Fbank特征和MFCC特征融合的声纹识别方法,其特征在于:所述的加窗的窗口选择为汉明窗。