知嘟嘟-专利交易平台_专利购买_专利出售-买专利,上嘟嘟

欢迎来到知嘟嘟！联系电话：13095918853 卖家免费入驻，海量在线求购！卖家免费入驻，海量在线求购！

嘟嘟会员

帮助中心网站地图

查出售查高校查求购查年费

我要发布

首页转移热力图Hot 专利交易委托购买高校专区科技服务专利求购年费查询行业资讯

联系电话：13095918853

知嘟嘟经纪人

语音识别方法、装置、设备及存储介质

￥28000

专利号： 201811105895X

申请人：百度在线网络技术(北京)有限公司

专利类型：发明专利

专利状态：已下证

专利领域：乐器；声学

更新日期：2024-02-23

缴费截止日期：暂无

价格&联系人

年费信息

委托购买

专利简介

专利详情

委托购买说明

需准备材料

常见问题

摘要:

权利要求书:

1.一种语音识别方法，其特征在于，包括：

获取终端设备上搭载的音频采集设备采集获得的语音信号，以及获取在采集获得所述语音信号时所述终端设备所在的第一区域；

采用预先存储的与所述第一区域对应的第一语音识别模型以及预先设定的所有区域通用的第二语音识别模型，对所述语音信号进行语音识别处理，其中所述第一语音识别模型是基于所述第一区域中的语音样本训练获得的；

基于所述第一语音识别模型的第一识别结果和所述第二语音识别模型的第二识别结果，确定目标输出的识别结果。

2.根据权利要求1所述的方法，其特征在于，所述基于所述第一语音识别模型的第一识别结果和所述第二语音识别模型的第二识别结果，确定目标输出的识别结果，包括：基于预设的概率计算模型，计算目标输出的识别结果为第一识别结果的概率，以及目标输出的识别结果为第二识别结果的概率，确定所述第一识别结果和所述第二识别结果中对应概率最大的为目标输出的识别结果。

3.根据权利要求1所述的方法，其特征在于，所述基于所述第一语音识别模型的第一识别结果和所述第二语音识别模型的第二识别结果，确定目标输出的识别结果，包括：对所述第一语音识别模型得到的第一识别结果和所述第二语音识别模型得到的第二识别结果进行纠错处理得到第三识别结果；

基于所述第一识别结果、第二识别结果和第三识别结果，形成第一集合；

基于预设打分模型计算所述第一集合中每个识别结果的打分；

基于每个识别结果的打分确定目标输出的识别结果。

4.根据权利要求3所述的方法，其特征在于，所述基于所述第一识别结果、第二识别结果和第三识别结果，形成第一集合，包括：分别对所述第一识别结果、第二识别结果和第三识别结果进行特征提取，基于特征提取的结果形成第一集合。

5.根据权利要求4所述的方法，其特征在于，所述基于每个识别结果的打分确定目标输出的识别结果，包括：确定打分最高的识别结果为目标输出的识别结果。

6.根据权利要求4所述的方法，其特征在于，所述基于每个识别结果的打分确定目标输出的识别结果，包括：针对所述第一集合中的每个识别结果，将所述识别结果与其对应的打分组成一个元素；

基于得到的所有元素形成第二集合；

将所述第二集合输入预先训练获得的排序机中，将排序机输出的排序最高的识别结果作为目标输出的识别结果。

7.根据权利要求1-6中任一项所述的方法，其特征在于，当所述第一语音识别模型和所述第二语音识别模型均得到多个识别结果时，所述基于所述第一语音识别模型的第一识别结果和所述第二语音识别模型的第二识别结果，确定目标输出的识别结果之前，所述方法还包括：确定所述第一语音识别模型得到的多个识别结果中输出频率最高的为第一识别结果；

确定所述第二语音识别模型得到的多个识别结果中输出频率最高的为第二识别结果。

8.根据权利要求1-6中任一项所述的方法，其特征在于，其特征在于，所述获取在采集获得所述语音信号时所述终端设备所在的第一区域之后，所述方法还包括：显示语音识别的区域条件为第一区域。

9.一种语音识别装置，其特征在于，包括：

获取模块，用于获取终端设备上搭载的音频采集设备采集获得的语音信号，以及获取在采集获得所述语音信号时所述终端设备所在的第一区域；

识别模块，用于采用预先存储的与所述第一区域对应的第一语音识别模型以及预先设定的所有区域通用的第二语音识别模型，对所述语音信号进行语音识别处理，其中所述第一语音识别模型是基于所述第一区域中的语音样本训练获得的；

第一确定模块，用于基于所述第一语音识别模型的第一识别结果和所述第二语音识别模型的第二识别结果，确定目标输出的识别结果。

10.根据权利要求9所述的装置，其特征在于，所述第一确定模块，包括：第一确定子模块，用于基于预设的概率计算模型，计算目标输出的识别结果为第一识别结果的概率，以及目标输出的识别结果为第二识别结果的概率，确定所述第一识别结果和所述第二识别结果中对应概率最大的为目标输出的识别结果。

11.根据权利要求9所述的装置，其特征在于，所述第一确定模块，包括：纠错子模块，用于对所述第一语音识别模型得到的第一识别结果和所述第二语音识别模型得到的第二识别结果进行纠错处理得到第三识别结果；

生成子模块，用于基于所述第一识别结果、第二识别结果和第三识别结果，形成第一集合；

打分子模块，用于基于预设打分模型计算所述第一集合中每个识别结果的打分；

第二确定子模块，用于基于每个识别结果的打分确定目标输出的识别结果。

12.根据权利要求11所述的装置，其特征在于，所述生成子模块，具体用于：分别对所述第一识别结果、第二识别结果和第三识别结果进行特征提取，基于特征提取的结果形成第一集合。