欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2012102267963
申请人: 北京百度网讯科技有限公司
专利类型:发明专利
专利状态:已下证
专利领域: 乐器;声学
更新日期:2024-02-23
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种语音解码方法,包括:

A.从待解码的语音特征流中获取当前语音特征帧;

B.利用当前语音特征帧对当前的各条解码路径进行扩展;

C.利用语音短时平稳特征从扩展后的各条解码路径中选取一条以上的解码路径作为当前的解码路径,并判断待解码的语音特征流是否已到达最后帧,如果是,则从当前的各条解码路径中确定最优解码路径作为对所述待解码的语音特征流进行解码的结果,否则将待解码的语音特征流的下一帧作为当前语音特征帧,返回所述步骤B。

2.根据权利要求1所述的方法,其特征在于,所述步骤B具体包括:根据已知的语音特征帧之间的状态跳转关系,确定当前的各条解码路径中最后一个状态节点代表的状态至当前语音特征帧之间所有可能的状态跳转,其中一种可能的状态跳转对应由当前语音特征帧的一个状态节点扩展而来的一条解码路径;

根据声学模型和语言模型确定扩展后的各条解码路径的得分。

3.根据权利要求2所述的方法,其特征在于,利用语音短时平稳特征从扩展后的各条解码路径中选取一条以上的解码路径作为当前的解码路径的步骤具体包括:从扩展后的各条解码路径中确定违背语音短时平稳特征的解码路径;

降低所述违背语音短时平稳特征的解码路径的得分;

根据各条解码路径的得分选取一条以上的解码路径作为当前的解码路径。

4.根据权利要求3所述的方法,其特征在于,确定违背语音短时平稳特征的解码路径的步骤具体包括:将扩展后的各条解码路径中相同状态的连续节点数低于限值的解码路径作为违背语音短时平稳特征的解码路径。

5.根据权利要求3所述的方法,其特征在于,根据各条解码路径的得分选取一条以上的解码路径作为当前的解码路径的步骤具体包括:从各条解码路径中选取得分最高的N条解码路径作为当前的解码路径,其中N为自然数;或者,将各条解码路径中得分与最高分之间差值大于设定值的解码路径剔除并将剩余解码路径作为当前的解码路径。

6.根据权利要求5所述的方法,其特征在于,所述步骤C中确定最优解码路径的步骤具体包括:将当前的各条解码路径中得分最高的解码路径作为最优解码路径。

7.一种语音解码装置,包括:

接收单元,用于从待解码的语音特征流中获取当前语音特征帧;

扩展单元,用于利用当前语音特征帧对当前的各条解码路径进行扩展;

选取单元,用于利用语音短时平稳特征从扩展后的各条解码路径中选取一条以上的解码路径作为当前的解码路径,并触发判断单元运行;

判断单元,用于判断待解码的语音特征流是否已到达最后帧,如果是,则从当前的各条解码路径中确定最优解码路径作为对所述待解码的语音特征流进行解码的结果,否则将待解码的语音特征流的下一帧作为当前语音特征帧并触发所述扩展单元运行。

8.根据权利要求7所述的装置,其特征在于,所述扩展单元具体包括:路径扩展子单元,用于根据已知的语音特征帧之间的状态跳转关系,确定当前的各条解码路径中最后一个状态节点代表的状态至当前语音特征帧之间所有可能的状态跳转,其中一种可能的状态跳转对应当前语音特征帧的一个状态节点扩展而来的一条解码路径;

得分确定子单元,用于根据声学模型和语言模型确定扩展后的各条解码路径的得分。

9.根据权利要求8所述的装置,其特征在于,所述选取单元具体包括:路径确定子单元,用于从扩展后的各条解码路径中确定违背语音短时平稳特征的解码路径;

惩罚子单元,用于降低所述违背语音短时平稳特征的解码路径的得分;

路径选取子单元,用于根据各条解码路径的得分选取一条以上的解码路径作为当前的解码路径。

10.根据权利要求9所述的装置,其特征在于,所述路径确定子单元将扩展后的各条解码路径中相同状态的连续节点数低于限值的解码路径作为违背语音短时平稳特征的解码路径。

11.根据权利要求9所述的装置,其特征在于,所述路径选取子单元从各条解码路径中选取得分最高的N条解码路径作为当前的解码路径,其中N为自然数;或者,将各条解码路径中得分与最高分之间差值大于设定值的解码路径剔除并将剩余解码路径作为当前的解码路径。

12.根据权利要求11所述的装置,其特征在于,所述判断单元确定最优解码路径的方式具体包括:将当前的各条解码路径中得分最高的解码路径作为最优解码路径。