欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2015110212896
申请人: 百度在线网络技术(北京)有限公司
专利类型:发明专利
专利状态:已下证
专利领域: 乐器;声学
更新日期:2024-02-23
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种语音识别方法,其特征在于,包括:

根据用户输入的语音向所述用户发出提问;

接收所述用户针对所提问题的答案;

根据所提问题所属的受限领域,进行正向语言模型和反向语言模型的竞争,获得所述答案的识别结果是否属于拒识范畴。

2.根据权利要求1所述的方法,其特征在于,所述根据所提问题所属的受限领域,进行正向语言模型和反向语言模型的竞争,获得所述答案的识别结果是否属于拒识范畴包括:如果所提问题属于强受限领域,则采用非交叉方式进行正向语言模型和反向语言模型的竞争,获得所述答案的识别结果是否属于拒识范畴;

如果所提问题属于关键受限领域,则采用交叉方式进行正向语言模型和反向语言模型的竞争,获得所述答案的识别结果是否属于拒识范畴。

3.根据权利要求2所述的方法,其特征在于,所述采用非交叉方式进行正向语言模型和反向语言模型的竞争,获得所述答案的识别结果是否属于拒识范畴包括:采用正向语言模型和反向语言模型分别对所述答案进行识别,分别获得所述正向语言模型对所述答案的识别结果的打分,以及所述反向语言模型对所述答案的识别结果的打分,其中,所述反向语言模型为通用语言模型减去所述正向语言模型之后的模型;

将所述正向语言模型对所述答案的识别结果的打分与所述反向语言模型对所述答案的识别结果的打分进行比较;

如果所述正向语言模型对所述答案的识别结果的打分较高,则确定所述答案的识别结果不属于拒识范畴;如果所述反向语言模型对所述答案的识别结果的打分较高,则确定所述答案的识别结果属于拒识范畴。

4.根据权利要求2所述的方法,其特征在于,所述采用交叉方式进行正向语言模型和反向语言模型的竞争,获得所述答案的识别结果是否属于拒识范畴包括:采用正向语言模型和反向语言模型对所述答案中的每一项N元文法分别进行打分,取分值较高的识别结果作为所述答案中每一项N元文法的识别结果,其中,所述反向语言模型为通用语言模型减去所述正向语言模型之后的模型;

根据最终获得的所述答案的识别结果中每个词和解析出所述词的语言模型的组合的重要程度,确定所述答案的识别结果是否属于拒识范畴。

5.根据权利要求1-4任意一项所述的方法,其特征在于,所述根据所提问题所属的受限领域,进行正向语言模型和反向语言模型的竞争,获得所述答案的识别结果是否属于拒识范畴之前,还包括:训练获得所述正向语言模型和所述反向语言模块,所述反向语言模型为通用语言模型减去所述正向语言模型之后的模型。

6.根据权利要求5所述的方法,其特征在于,所述正向语言模型包括强受限领域语言模型;

所述训练获得强受限领域语言模型包括:

通过正则表达式构造出类语言模型的原始语料;

穷举所述类语言模型的原始语料中需要填充的类内语料;

如果所述原始语料和所述类内语料组合生成的训练语料的规模小于或等于预定阈值,则对所述训练语料进行训练,生成所述强受限领域语言模型;

如果所述原始语料和所述类内语料组合生成的训练语料的规模大于预定阈值,则生成所述类语言模型的原始语料中需要填充的类内语料的表述语言模型,将所述类语言模型与所述表述语言模型进行组合,生成所述强受限领域语言模型。

7.根据权利要求5所述的方法,其特征在于,所述正向语言模型包括关键受限领域语言模型;

所述训练获得关键受限领域语言模型包括:

通过正则表达式构造出类语言模型的原始语料;

穷举所述类语言模型的原始语料中需要填充的类内关键词的所有语料;

将所述原始语料与所述类内关键词的所有语料组合生成训练语料,并对所述训练语料进行训练,获得关键受限领域语言模型。

8.根据权利要求7所述的方法,其特征在于,所述获得关键受限领域语言模型之后,还包括:保留所述关键受限领域语言模型中所述类内关键词的语料的全部N元文法的概率,减小非类内关键词的语料的N元文法的概率。

9.一种语音识别装置,其特征在于,包括:

提问模块,用于根据用户输入的语音向所述用户发出提问;

接收模块,用于接收所述用户针对所提问题的答案;

获得模块,用于根据所述提问模块所提问题所属的受限领域,进行正向语言模型和反向语言模型的竞争,获得所述接收模块接收的答案的识别结果是否属于拒识范畴。

10.根据权利要求9所述的装置,其特征在于,

所述获得模块,具体用于当所述提问模块所提问题属于强受限领域时,采用非交叉方式进行正向语言模型和反向语言模型的竞争,获得所述答案的识别结果是否属于拒识范畴;当所述提问模块所提问题属于关键受限领域时,采用交叉方式进行正向语言模型和反向语言模型的竞争,获得所述答案的识别结果是否属于拒识范畴。

11.根据权利要求10所述的装置,其特征在于,所述获得模块包括:打分子模块,用于采用正向语言模型和反向语言模型分别对所述答案进行识别,分别获得所述正向语言模型对所述答案的识别结果的打分,以及所述反向语言模型对所述答案的识别结果的打分,其中,所述反向语言模型为通用语言模型减去所述正向语言模型之后的模型;

比较子模块,用于将所述打分子模块获得的正向语言模型对所述答案的识别结果的打分与所述打分子模块获得的反向语言模型对所述答案的识别结果的打分进行比较;

确定子模块,用于当所述正向语言模型对所述答案的识别结果的打分较高时,确定所述答案的识别结果不属于拒识范畴;当所述反向语言模型对所述答案的识别结果的打分较高时,确定所述答案的识别结果属于拒识范畴。

12.根据权利要求10所述的装置,其特征在于,所述获得模块包括:打分子模块,用于采用正向语言模型和反向语言模型对所述答案中的每一项N元文法分别进行打分,其中,所述反向语言模型为通用语言模型减去所述正向语言模型之后的模型;

比较子模块,用于取分值较高的识别结果作为所述答案中每一项N元文法的识别结果;

确定子模块,用于根据最终获得的所述答案的识别结果中每个词和解析出所述词的语言模型的组合的重要程度,确定所述答案的识别结果是否属于拒识范畴。

13.根据权利要求9-12任意一项所述的装置,其特征在于,还包括:训练模块,用于训练获得所述正向语言模型和所述反向语言模块,所述反向语言模型为通用语言模型减去所述正向语言模型之后的模型。

14.根据权利要求13所述的装置,其特征在于,所述正向语言模型包括强受限领域语言模型;

所述训练模块包括:

构造子模块,用于通过正则表达式构造出类语言模型的原始语料;

穷举子模块,用于穷举所述构造子模块构造的类语言模型的原始语料中需要填充的类内语料;

生成子模块,用于当所述原始语料和所述类内语料组合生成的训练语料的规模小于或等于预定阈值时,对所述训练语料进行训练,生成所述强受限领域语言模型;当所述原始语料和所述类内语料组合生成的训练语料的规模大于预定阈值时,生成所述类语言模型的原始语料中需要填充的类内语料的表述语言模型,将所述类语言模型与所述表述语言模型进行组合,生成所述强受限领域语言模型。

15.根据权利要求13所述的装置,其特征在于,所述正向语言模型包括关键受限领域语言模型;

所述训练模块包括:

构造子模块,用于通过正则表达式构造出类语言模型的原始语料;

穷举子模块,用于穷举所述构造子模块构造的类语言模型的原始语料中需要填充的类内关键词的所有语料;

生成子模块,用于将所述原始语料与所述类内关键词的所有语料组合生成训练语料,并对所述训练语料进行训练,获得关键受限领域语言模型。

16.根据权利要求15所述的装置,其特征在于,所述训练模块还包括:优化子模块,用于在所述生成子模块获得关键受限领域语言模型之后,保留所述关键受限领域语言模型中所述类内关键词的语料的全部N元文法的概率,减小非类内关键词的语料的N元文法的概率。