欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2015109205887
申请人: 百度在线网络技术(北京)有限公司
专利类型:发明专利
专利状态:已下证
专利领域: 乐器;声学
更新日期:2024-02-23
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种语音识别方法,其特征在于,包括:获取待识别的语音信号的特征;

根据所述特征在构图生成的搜索空间内进行路径搜索,输出解码结果;

根据所述解码结果判断是否需要拒识;

如果需要拒识,则确定语音识别结果是拒识,如果不需要拒识,则根据所述解码结果获取语音识别结果。

2.根据权利要求1所述的方法,其特征在于,所述根据所述解码结果判断是否需要拒识,包括:根据所述解码结果,统计垃圾词和反模型的数量、非意图对象的数量、关键词的数量和句子长度,并获取每个关键词的置信度;

如果所述垃圾词和反模型的数量大于0,则判断出需要拒识;或者,确定非意图对象的数量和关键词的数量之和与句子长度的比值,如果所述比值小于预设比值,则判断出需要拒识;或者,如果关键词的置信度小于预设置信度值,则判断出需要拒识。

3.根据权利要求1所述的方法,其特征在于,还包括:获取开发者编辑的内容;

确定所述内容中的意图对象和非意图对象,并获取所述意图对象和非意图对象对应的反模型和垃圾词模型;

根据所述开发者编辑的内容、所述反模型和垃圾词模型,构图生成搜索空间。

4.根据权利要求3所述的方法,其特征在于,还包括:获取语言模型,并在构图生成搜索空间时,在所述搜索空间的静音状态后加入所述语言模型。

5.根据权利要求3或4所述的方法,其特征在于,还包括:在所述搜索空间的路径结尾处加入预设标识,以便在路径搜索包含所述预设标识时,即时输出解码结果。

6.根据权利要求1所述的方法,其特征在于,所述获取待识别的语音信号的特征,包括:获取待识别的语音信号;

对所述语音信号进行前端信号处理,所述前端信号处理包括:低频去噪,和/或,信号增强;

对前端信号处理后的语音信号进行VAD;

对VAD检测出的语音信号进行特征提取,获取所述语音信号的特征。

7.根据权利要求1所述的方法,其特征在于,还包括:在获取语音识别结果后,重置语音识别的场景。

8.一种语音识别装置,其特征在于,包括:获取模块,用于获取待识别的语音信号的特征;

解码模块,用于根据所述特征在构图生成的搜索空间内进行路径搜索,输出解码结果;

判断模块,用于根据所述解码结果判断是否需要拒识;

确定模块,用于如果需要拒识,则确定语音识别结果是拒识,如果不需要拒识,则根据所述解码结果获取语音识别结果。

9.根据权利要求8所述的装置,其特征在于,所述判断模块具体用于:根据所述解码结果,统计垃圾词和反模型的数量、非意图对象的数量、关键词的数量和句子长度,并获取每个关键词的置信度;

如果所述垃圾词和反模型的数量大于0,则判断出需要拒识;或者,确定非意图对象的数量和关键词的数量之和与句子长度的比值,如果所述比值小于预设比值,则判断出需要拒识;或者,如果关键词的置信度小于预设置信度值,则判断出需要拒识。

10.根据权利要求8所述的装置,其特征在于,还包括:构图模块,用于获取开发者编辑的内容;确定所述内容中的意图对象和非意图对象,并获取所述意图对象和非意图对象对应的反模型和垃圾词模型;根据所述开发者编辑的内容、所述反模型和垃圾词模型,构图生成搜索空间。

11.根据权利要求10所述的装置,其特征在于,所述构图模块还用于:获取语言模型,并在构图生成搜索空间时,在所述搜索空间的静音状态后加入所述语言模型。

12.根据权利要求10或11所述的装置,其特征在于,所述构图模块还用于:在所述搜索空间的路径结尾处加入预设标识,以便在路径搜索包含所述预设标识时,即时输出解码结果。

13.根据权利要求8所述的装置,其特征在于,所述获取模块具体用于:获取待识别的语音信号;

对所述语音信号进行前端信号处理,所述前端信号处理包括:低频去噪,和/或,信号增强;

对前端信号处理后的语音信号进行VAD;

对VAD检测出的语音信号进行特征提取,获取所述语音信号的特征。

14.根据权利要求8所述的装置,其特征在于,还包括:重置模块,用于在获取语音识别结果后,重置语音识别的场景。