欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2017105254224
申请人: 百度在线网络技术(北京)有限公司
专利类型:发明专利
专利状态:已下证
专利领域: 乐器;声学
更新日期:2024-02-23
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种语音唤醒方法,其特征在于,包括:

获取用于唤醒智能终端的唤醒语音;

利用所述智能终端的预设声学模型和预设唤醒词识别网络,对所述唤醒语音的声学特征进行分析,获得所述唤醒语音相对预设唤醒词的声学特征的置信度;

若所述置信度位于预设的中等置信度范围内,则将所述唤醒语音上传到远程服务器;

若利用所述远程服务器中的语言模型对所述唤醒语音分析得到的语言特征,与所述预设唤醒词的语言特征匹配一致,则接收所述远程服务器生成的智能终端唤醒指令。

2.根据权利要求1所述方法,其特征在于,在若利用所述远程服务器中的语言模型对所述唤醒语音分析得到的语言特征与所述预设唤醒词的语言特征匹配一致之后,还包括:利用所述唤醒语音,对所述远程服务器中的语言模型进行训练。

3.根据权利要求1所述的方法,其特征在于,在获得所述唤醒语音相对预设唤醒词的声学特征的置信度之后,还包括:若所述置信度大于所述中等置信度范围中的最大置信度,则执行唤醒所述智能终端的操作。

4.根据权利要求1所述的方法,其特征在于,所述利用所述智能终端的预设声学模型和预设唤醒词识别网络,对所述唤醒语音的声学特征进行分析,获得所述唤醒语音相对预设唤醒词的声学特征的置信度,包括:提取所述唤醒语音的声学特征;

根据预设声学模型对所述声学特征进行分析,得到所述唤醒语音对应的N个状态及所述N个状态的似然得分,其中,N为正整数;

根据得到的似然得分基于维特比算法,从所述唤醒词识别网络中确定将所述N个状态组合成所述预设唤醒词的声学特征的概率,并将所述概率作为所述置信度。

5.根据权利要求1所述的方法,其特征在于,若利用所述远程服务器中的语言模型对所述唤醒语音分析得到的语言特征,与所述预设唤醒词的语言特征匹配一致,包括:基于预设声学模型对所述唤醒语音的声学特征的分析结果,通过所述语言模型生成与所述唤醒语音对应的文字序列;

将唤醒语音对应的文字序列作为所述唤醒语音的语言特征,与所述预设唤醒词的语言特征,即所述预设唤醒词的文字序列进行匹配。

6.根据权利要求1所述的方法,其特征在于,还包括:

若获取所述智能终端的唤醒词自定义触发指令和待处理唤醒词数据,则根据所述唤醒词自定义触发指令和所述待处理唤醒词数据,对所述预设唤醒词识别网络和所述预设唤醒词的语言特征进行处理。

7.根据权利要求6所述的方法,其特征在于,根据所述唤醒词自定义触发指令和所述待处理唤醒词数据,对所述预设唤醒词识别网络和所述预设唤醒词的语言特征进行处理包括:若所述唤醒词自定义触发指令是更改唤醒词,则将所述预设唤醒词识别网络替换为,利用所述待处理唤醒词数据中待处理唤醒词的语音信息构建的唤醒词识别网络,并将所述预设唤醒词的语言特征替换为,所述待处理唤醒词数据中的待处理唤醒词的文字序列。

8.根据权利要求6所述的方法,其特征在于,所述唤醒词自定义触发指令至少包括删除唤醒词、更改唤醒词和添加唤醒词。

9.根据权利要求6所述的方法,其特征在于,所述唤醒词自定义触发指令的触发方式包括点击网页上的虚拟控件和/或播放设定音频数据。

10.一种语音唤醒装置,其特征在于,包括:

语音获取模块,用于获取用于唤醒智能终端的唤醒语音;

声学特征匹配模块,用于利用所述智能终端的预设声学模型和预设唤醒词识别网络,对所述唤醒语音的声学特征进行分析,获得所述唤醒语音相对预设唤醒词的声学特征的置信度;

语音上传模块,用于若所述置信度位于预设的中等置信度范围内,则将所述唤醒语音上传到远程服务器;

语言特征匹配模块,用于若利用所述远程服务器中的语言模型对所述唤醒语音分析得到的语言特征,与所述预设唤醒词的语言特征匹配一致,则接收所述远程服务器生成的智能终端唤醒指令。

11.根据权利要求10所述的装置,其特征在于,还包括:语言训练模块,用于在若利用所述远程服务器中的语言模型对所述唤醒语音分析得到的语言特征,与所述预设唤醒词的语言特征匹配一致之后,利用所述唤醒语音,对远程服务器中的语言模型进行训练。

12.根据权利要求10所述的装置,其特征在于,还包括:唤醒词自定义模块,用于若获取所述智能终端的唤醒词自定义触发指令和待处理唤醒词数据,则根据所述唤醒词自定义触发指令和所述待处理唤醒词数据,对所述预设唤醒词识别网络和预设唤醒词的语言特征进行处理。

13.一种终端,其特征在于,所述终端包括:

一个或多个处理器;

存储装置,用于存储一个或多个程序,

当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-9中任一所述的语音唤醒方法。

14.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-9中任一所述的语音唤醒方法。