欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 201811105895X
申请人: 百度在线网络技术(北京)有限公司
专利类型:发明专利
专利状态:已下证
专利领域: 乐器;声学
更新日期:2024-02-23
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种语音识别方法,其特征在于,包括:

获取终端设备上搭载的音频采集设备采集获得的语音信号,以及获取在采集获得所述语音信号时所述终端设备所在的第一区域;

采用预先存储的与所述第一区域对应的第一语音识别模型以及预先设定的所有区域通用的第二语音识别模型,对所述语音信号进行语音识别处理,其中所述第一语音识别模型是基于所述第一区域中的语音样本训练获得的;

基于所述第一语音识别模型的第一识别结果和所述第二语音识别模型的第二识别结果,确定目标输出的识别结果。

2.根据权利要求1所述的方法,其特征在于,所述基于所述第一语音识别模型的第一识别结果和所述第二语音识别模型的第二识别结果,确定目标输出的识别结果,包括:基于预设的概率计算模型,计算目标输出的识别结果为第一识别结果的概率,以及目标输出的识别结果为第二识别结果的概率,确定所述第一识别结果和所述第二识别结果中对应概率最大的为目标输出的识别结果。

3.根据权利要求1所述的方法,其特征在于,所述基于所述第一语音识别模型的第一识别结果和所述第二语音识别模型的第二识别结果,确定目标输出的识别结果,包括:对所述第一语音识别模型得到的第一识别结果和所述第二语音识别模型得到的第二识别结果进行纠错处理得到第三识别结果;

基于所述第一识别结果、第二识别结果和第三识别结果,形成第一集合;

基于预设打分模型计算所述第一集合中每个识别结果的打分;

基于每个识别结果的打分确定目标输出的识别结果。

4.根据权利要求3所述的方法,其特征在于,所述基于所述第一识别结果、第二识别结果和第三识别结果,形成第一集合,包括:分别对所述第一识别结果、第二识别结果和第三识别结果进行特征提取,基于特征提取的结果形成第一集合。

5.根据权利要求4所述的方法,其特征在于,所述基于每个识别结果的打分确定目标输出的识别结果,包括:确定打分最高的识别结果为目标输出的识别结果。

6.根据权利要求4所述的方法,其特征在于,所述基于每个识别结果的打分确定目标输出的识别结果,包括:针对所述第一集合中的每个识别结果,将所述识别结果与其对应的打分组成一个元素;

基于得到的所有元素形成第二集合;

将所述第二集合输入预先训练获得的排序机中,将排序机输出的排序最高的识别结果作为目标输出的识别结果。

7.根据权利要求1-6中任一项所述的方法,其特征在于,当所述第一语音识别模型和所述第二语音识别模型均得到多个识别结果时,所述基于所述第一语音识别模型的第一识别结果和所述第二语音识别模型的第二识别结果,确定目标输出的识别结果之前,所述方法还包括:确定所述第一语音识别模型得到的多个识别结果中输出频率最高的为第一识别结果;

确定所述第二语音识别模型得到的多个识别结果中输出频率最高的为第二识别结果。

8.根据权利要求1-6中任一项所述的方法,其特征在于,其特征在于,所述获取在采集获得所述语音信号时所述终端设备所在的第一区域之后,所述方法还包括:显示语音识别的区域条件为第一区域。

9.一种语音识别装置,其特征在于,包括:

获取模块,用于获取终端设备上搭载的音频采集设备采集获得的语音信号,以及获取在采集获得所述语音信号时所述终端设备所在的第一区域;

识别模块,用于采用预先存储的与所述第一区域对应的第一语音识别模型以及预先设定的所有区域通用的第二语音识别模型,对所述语音信号进行语音识别处理,其中所述第一语音识别模型是基于所述第一区域中的语音样本训练获得的;

第一确定模块,用于基于所述第一语音识别模型的第一识别结果和所述第二语音识别模型的第二识别结果,确定目标输出的识别结果。

10.根据权利要求9所述的装置,其特征在于,所述第一确定模块,包括:第一确定子模块,用于基于预设的概率计算模型,计算目标输出的识别结果为第一识别结果的概率,以及目标输出的识别结果为第二识别结果的概率,确定所述第一识别结果和所述第二识别结果中对应概率最大的为目标输出的识别结果。

11.根据权利要求9所述的装置,其特征在于,所述第一确定模块,包括:纠错子模块,用于对所述第一语音识别模型得到的第一识别结果和所述第二语音识别模型得到的第二识别结果进行纠错处理得到第三识别结果;

生成子模块,用于基于所述第一识别结果、第二识别结果和第三识别结果,形成第一集合;

打分子模块,用于基于预设打分模型计算所述第一集合中每个识别结果的打分;

第二确定子模块,用于基于每个识别结果的打分确定目标输出的识别结果。

12.根据权利要求11所述的装置,其特征在于,所述生成子模块,具体用于:分别对所述第一识别结果、第二识别结果和第三识别结果进行特征提取,基于特征提取的结果形成第一集合。

13.根据权利要求12所述的装置,其特征在于,所述第二确定子模块,包括:第一确定子单元,用于确定打分最高的识别结果为目标输出的识别结果。

14.根据权利要求12所述的装置,其特征在于,所述第二确定子模块,包括:第一构建子单元,用于针对所述第一集合中的每个识别结果,将所述识别结果与其对应的打分组成一个元素;

形成子单元,用于基于得到的所有元素形成第二集合;

第二确定子单元,用于将所述第二集合输入预先训练获得的排序机中,将排序机输出的排序最高的识别结果作为目标输出的识别结果。

15.根据权利要求9-14中任一项所述的装置,其特征在于,所述装置还包括:第二确定模块,用于确定所述第一语音识别模型得到的多个识别结果中输出频率最高的为第一识别结果;

第三确定模块,用于确定所述第二语音识别模型得到的多个识别结果中输出频率最高的为第二识别结果。

16.根据权利要求9-14中任一项所述的装置,其特征在于,所述装置还包括:显示模块,用于显示语音识别的区域条件为第一区域。

17.一种计算机设备,其特征在于,包括:

一个或多个处理器;

一个或多个音频采集设备,所述音频采集设备与所述处理器连接,用于采集语音信号;

存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-8中任一项所述的方法。

18.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-8中任一项所述的方法。