知嘟嘟-专利交易平台_专利购买_专利出售-买专利,上嘟嘟

欢迎来到知嘟嘟！联系电话：13095918853 卖家免费入驻，海量在线求购！卖家免费入驻，海量在线求购！

嘟嘟会员

帮助中心网站地图

查出售查高校查求购查年费

我要发布

首页转移热力图Hot 专利交易委托购买高校专区科技服务专利求购年费查询行业资讯

联系电话：13095918853

知嘟嘟经纪人

语音识别方法和装置

￥28000

专利号： 2015109205887

申请人：百度在线网络技术(北京)有限公司

专利类型：发明专利

专利状态：已下证

专利领域：乐器；声学

更新日期：2024-02-23

缴费截止日期：暂无

价格&联系人

年费信息

委托购买

专利简介

专利详情

委托购买说明

需准备材料

常见问题

摘要:

权利要求书:

1.一种语音识别方法，其特征在于，包括：获取待识别的语音信号的特征；

根据所述特征在构图生成的搜索空间内进行路径搜索，输出解码结果；

根据所述解码结果判断是否需要拒识；

如果需要拒识，则确定语音识别结果是拒识，如果不需要拒识，则根据所述解码结果获取语音识别结果。

2.根据权利要求1所述的方法，其特征在于，所述根据所述解码结果判断是否需要拒识，包括：根据所述解码结果，统计垃圾词和反模型的数量、非意图对象的数量、关键词的数量和句子长度，并获取每个关键词的置信度；

如果所述垃圾词和反模型的数量大于0，则判断出需要拒识；或者，确定非意图对象的数量和关键词的数量之和与句子长度的比值，如果所述比值小于预设比值，则判断出需要拒识；或者，如果关键词的置信度小于预设置信度值，则判断出需要拒识。

3.根据权利要求1所述的方法，其特征在于，还包括：获取开发者编辑的内容；

确定所述内容中的意图对象和非意图对象，并获取所述意图对象和非意图对象对应的反模型和垃圾词模型；

根据所述开发者编辑的内容、所述反模型和垃圾词模型，构图生成搜索空间。

4.根据权利要求3所述的方法，其特征在于，还包括：获取语言模型，并在构图生成搜索空间时，在所述搜索空间的静音状态后加入所述语言模型。

5.根据权利要求3或4所述的方法，其特征在于，还包括：在所述搜索空间的路径结尾处加入预设标识，以便在路径搜索包含所述预设标识时，即时输出解码结果。

6.根据权利要求1所述的方法，其特征在于，所述获取待识别的语音信号的特征，包括：获取待识别的语音信号；

对所述语音信号进行前端信号处理，所述前端信号处理包括：低频去噪，和/或，信号增强；

对前端信号处理后的语音信号进行VAD；

对VAD检测出的语音信号进行特征提取，获取所述语音信号的特征。

7.根据权利要求1所述的方法，其特征在于，还包括：在获取语音识别结果后，重置语音识别的场景。

8.一种语音识别装置，其特征在于，包括：获取模块，用于获取待识别的语音信号的特征；

解码模块，用于根据所述特征在构图生成的搜索空间内进行路径搜索，输出解码结果；

判断模块，用于根据所述解码结果判断是否需要拒识；

确定模块，用于如果需要拒识，则确定语音识别结果是拒识，如果不需要拒识，则根据所述解码结果获取语音识别结果。

9.根据权利要求8所述的装置，其特征在于，所述判断模块具体用于：根据所述解码结果，统计垃圾词和反模型的数量、非意图对象的数量、关键词的数量和句子长度，并获取每个关键词的置信度；

10.根据权利要求8所述的装置，其特征在于，还包括：构图模块，用于获取开发者编辑的内容；确定所述内容中的意图对象和非意图对象，并获取所述意图对象和非意图对象对应的反模型和垃圾词模型；根据所述开发者编辑的内容、所述反模型和垃圾词模型，构图生成搜索空间。

11.根据权利要求10所述的装置，其特征在于，所述构图模块还用于：获取语言模型，并在构图生成搜索空间时，在所述搜索空间的静音状态后加入所述语言模型。

12.根据权利要求10或11所述的装置，其特征在于，所述构图模块还用于：在所述搜索空间的路径结尾处加入预设标识，以便在路径搜索包含所述预设标识时，即时输出解码结果。

13.根据权利要求8所述的装置，其特征在于，所述获取模块具体用于：获取待识别的语音信号；

对所述语音信号进行前端信号处理，所述前端信号处理包括：低频去噪，和/或，信号增强；

对前端信号处理后的语音信号进行VAD；

对VAD检测出的语音信号进行特征提取，获取所述语音信号的特征。

14.根据权利要求8所述的装置，其特征在于，还包括：重置模块，用于在获取语音识别结果后，重置语音识别的场景。

推荐专利

我要求购

我不想找了，帮我找吧

您有专利需要变现?

我要出售

智能匹配需求，快速出售

摘要:

权利要求书:

知嘟嘟

友情链接

关于我们

联系我们