欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2012105920932
申请人: 北京百度网讯科技有限公司
专利类型:发明专利
专利状态:已下证
专利领域: 乐器;声学
更新日期:2024-02-23
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种语音基音周期检测方法,其特征在于,包括以下步骤: 接收语音输入信号并对所述语音输入信号进行预处理,其中,所述语音输入信号包括多帧语音信号; 对所述语音输入信号中的每帧语音信号进行先验信噪比估计以获得每帧语音信号对应的先验信噪比; 根据每帧语音信号对应的先验信噪比获得每帧语音信号对应的权重值; 提取所述多帧语音信号中的多个基音候选项; 根据所述多个基音候选项和先验信噪比按照预设周期对所述多帧语音信号进行第一次动态规划以获得多个第一基音路径及所述第一基音路径对应的代价信息; 根据所述第一基音路径对应的代价信息对所述多个第一基音路径进行第二次动态规划以生成至少一个第二基音路径;以及 根据所述至少一个第二基音路径检测所述语音基音周期。

2.如权利要求1所述的语音基音周期检测方法,其特征在于,对所述语音输入信号进行预处理进一步包括: 对所述语音输入信号进行分帧处理,并对所述语音输入信号进行噪声估计以获得当前噪声估计信息。

3.如权利要求2所述的语音基音周期检测方法,其特征在于,对所述语音输入信号进行预处理还包括: 对所述语音输入信号进行预加重、加窗及FFT处理。

4.如权利要求1-3任一项所述的语音基音周期检测方法,其特征在于,通过以下公式获得每帧语音信号对应的先验信噪比: 其中,SNRapriori(f,i)表示当前帧语音信号的先验信噪比,X(f,i-1)表示语音信号的频谱,N(f)表示噪声信号的频谱,i表示帧索引,α表示加权因子,SNRpost表示前一帧的先验信噪比。

5.如权利要求4所述的语音基音周期检测方法,其特征在于,通过以下公式获得每帧语音信号对应的权重值: 其中,SNRapriori(f,i)表示当前帧语音信号的先验信噪比,i表示帧索引,Thrsnr表示预定阈值。

6.如权利要求1所述的语音基音周期检测方法,其特征在于,根据相关性检测方法提取所述多帧语音信号中的多个基音候选项。

7.如权利要求5所述的语音基音周期检测方法,其特征在于,所述根据多个基音候选项和先验信噪比按照预设周期对所述多帧语音信号进行第一次动态规划以获得多个第一基音路径及所述第一基音路径对应的代价信息进一步包括: 获得所述多个基音候选项中每个基音候选项对应的权重值,所述权重值包括第一权重值和第二权重值,其中,所述第一权重值与所述基音候选项对应的先验信噪比相关,所述第二权重值与相关函数的峰值强度相关。

8.如权利要求7所述的语音基音周期检测方法,其特征在于,所述根据第一基音路径对应的代价信息对所述多个第一基音路径进行第二次动态规划以生成至少一个第二基音路径进一步包括: 对所述语音输入信号进行分段以生成多个语音段,其中,每个语音段包括多个第一基音路径; 根据代价信息对所述每个语音段中的多个第一基音路径进行排序; 选取所述每个语音段中前N个第一基音路径,N为正整数;以及 对多个语音段中每个语音段中选择的前N个第一基音路径进行第二次动态规划以生成至少一个第二基音路径。

9.如权利要求1所述的语音基音周期检测方法,其特征在于,还包括: 对所述至少一个第二基音路径进行平滑处理。

10.一种语音基音周期检测装置,其特征在于,包括:

预处理模块,用于接收语音输入信号并对所述语音输入信号进行预处理,其中,所述语音输入信号包括多帧语音信号; 第一获取模块,用于对所述语音输入信号中的每帧语音信号进行先验信噪比估计以获得每帧语音信号对应的先验信噪比; 第二获取模块,用于根据每帧语音信号对应的先验信噪比获得每帧语音信号对应的权重值; 提取模块,用于提取所述多帧语音信号中的多个基音候选项;

第一动态规划模块,用于根据所述多个基音候选项和先验信噪比按照预设周期对所述多帧语音信号进行第一次动态规划以获得多个第一基音路径及所述第一基音路径对应的代价信息; 第二动态规划模块,用于根据所述第一基音路径对应的代价信息对所述多个第一基音路径进行第二次动态规划以生成至少一个第二基音路径;以及 检测模块,用于根据所述至少一个第二基音路径检测所述语音基音周期。

11.如权利要求10所述的语音基音周期检测装置,其特征在于,所述预处理模块包括: 分帧单元,用于对所述语音输入信号进行分帧处理,并对所述语音输入信号进行噪声估计以获得当前噪声估计信息。

12.如权利要求11所述的语音基音周期检测装置,其特征在于,所述 预处理模块还包括: 预加重单元,用于对所述语音输入信号进行预加重、加窗及FFT处理。

13.如权利要求10-12任一项所述的语音基音周期检测装置,其特征在于,所述第一获取模块通过以下公式获得每帧语音信号对应的先验信噪比: 其中,SNRapriori(f,i)表示当前帧语音信号的先验信噪比,X(f,i-1)表示语音信号的频谱,N(f)表示噪声信号的频谱,i表示帧索引,α表示加权因子,SNRpost表示前一帧的先验信噪比。

14.如权利要求13所述的语音基音周期检测装置,其特征在于,所述第二获取模块通过以下公式获得每帧语音信号对应的权重值: 其中,SNRapriori(f,i)表示当前帧语音信号的先验信噪比,i表示帧索引,Thrsnr表示预定阈值。

15.如权利要求10所述的语音基音周期检测装置,其特征在于,所述提取模块还用于根据相关性检测方法提取所述多帧语音信号中的多个基音候选项。

16.如权利要求14所述的语音基音周期检测装置,其特征在于,所述第一规划模块还用于: 获得所述多个基音候选项中每个基音候选项对应的权重值,所述权重值包括第一权重值和第二权重值,其中,所述第一权重值与所述基音候选项对应的先验信噪比相关,所述第二权重值与相关函数的峰值强度相关。

17.如权利要求16所述的语音基音周期检测装置,其特征在于,所述第二动态规划模块包括: 分段单元,用于对所述语音输入信号进行分段以生成多个语音段,其中,每个语音段包括多个第一基音路径; 排序单元,用于根据代价信息对所述每个语音段中的多个第一基音路径进行排序; 选择单元,用于选取所述每个语音段中前N个第一基音路径,N为正整数;以及 动态规划单元,用于对多个语音段中每个语音段中选择的前N个第一基音路径进行第二次动态规划以生成至少一个第二基音路径。

18.如权利要求10所述的语音基音周期检测装置,其特征在于,还包括: 平滑模块,用于对所述至少一个第二基音路径进行平滑处理。