欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2021105708628
申请人: 北京基智科技有限公司
专利类型:发明专利
专利状态:已下证
专利领域: 乐器;声学
更新日期:2024-02-23
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种语音助手识别方法,应用于电子装置,其特征在于,所述方法包括:

根据语音助手识别指令,获取与所述语音助手识别指令相对应的预设测试问题语音模板;

将对所述预设测试问题语音模板的回复语音作为识别判断语音,通过关键字识别模型对所述识别判断语音进行关键字识别,得到关键字识别结果;

若所述关键字识别结果为非语音助手的信息,通过语调识别模型对所述识别判断语音进行语调识别,得到语调识别结果;当获取的所述关键字识别结果为语音助手的信息时,获取预先与当前通话为语音助手的语音助手识别结果所匹配的通话操作指令,并停止后续对所述识别判断语音进行的语调识别和语义识别;

若所述语调识别结果为非语音助手的信息,通过语义识别模型对所述识别判断语音进行语义识别,得到语义识别结果,将所述语义识别结果作为语音助手识别结果;当获取的所述语调识别结果为语音助手的信息时,获取预先与当前通话为语音助手的语音助手识别结果所匹配的通话操作指令,并停止后续对所述识别判断语音进行的语义识别;其中,所述语义识别模型包括:用于输入所述识别判断语音的输入层、用于对所述输入层的识别判断语音进行文本转换的文本转换层、用于将所述文本转换层中得到的文本进行分词处理的分词层、用于对所述分词层中得到的分词映射成浮点数向量的编码器层、用于对所述编码器层得到的编码进行解码的解码器层、用于对解码器层解码后得到的语音进行分析的分析层和将所述分析层得到的语意识别结果进行输出的输出层。

2.根据权利要求1所述的语音助手识别方法,其特征在于,所述将对所述预设测试问题语音模板的回复语音作为识别判断语音,通过关键字识别模型对所述识别判断语音进行关键字识别,得到关键字识别结果的步骤,具体包括:将所述识别判断语音进行语音文本处理,得到识别判断语音文本;

将所述识别判断语音文本输入所述关键字识别模型,通过所述关键字识别模型对所述识别判断语音文本中的关键字进行识别,得到所述关键字识别结果;其中,所述关键字识别模型包括:用于输入识别判断语音文本的输入层、用于对所述输入层输入的识别判断语音文本进行分词处理的分词层、用于将所述分词层得到的分词与预设关键字模板进行比对的关键字比对层;用于对所述关键字比对层得到的比对结果进行分析的识别结果分析层和用于对所述识别结果分析层生成的识别结果进行输出的关键字识别结果输出层。

3.根据权利要求1所述的语音助手识别方法,其特征在于,所述若所述关键字识别结果为非语音助手的信息,通过语调识别模型对所述识别判断语音进行语调识别,得到语调识别结果的步骤,具体包括:对所述识别判断语音进行预处理,得到待识别判断语音,其中,所述预处理包括:降噪处理、预加重处理、分帧加窗处理;

对所述待识别判断语音进行语调特征提取处理,得到语调特征参数;

将所述语调特征参数与预设语音助手的语调特征参数模板进行比对,得到语调识别结果。

4.根据权利要求1‑3中任一项所述的语音助手识别方法,其特征在于,在所述若所述语调识别结果为非语音助手的信息,通过语义识别模型对所述识别判断语音进行语义识别,得到语义识别结果,将所述语义识别结果作为语音助手识别结果之后,进一步包括:根据所述语音助手识别结果,获取预先与所述语音助手识别结果相匹配的预设通话操作指令;其中,所述语音助手识别结果包括通话为语音助手和通话为非语音助手;所述预设通话操作指令包括与所述通话为语音助手匹配的识别语音助手通话操作指令和与所述通话为非语音助手匹配的非语音助手通话操作指令;

根据所述预设通话操作指令,对当前通话进行处理。

5.根据权利要求1所述的语音助手识别方法,其特征在于,在所述获取与所述语音助手识别指令相对应的预设测试问题语音模板之前,进一步包括:根据获取的通话连接成功的信息,生成语音助手识别指令。

6.一种语音助手识别装置,其特征在于,所述装置包括:

语音模板获取模块,用于根据语音助手识别指令,获取与所述语音助手识别指令相对应的预设测试问题语音模板;

关键字识别模块,用于将对所述预设测试问题语音模板的回复语音作为识别判断语音,通过关键字识别模型对所述识别判断语音进行关键字识别,得到关键字识别结果;

语调识别模块,用于若所述关键字识别结果为非语音助手的信息,通过语调识别模型对所述识别判断语音进行语调识别,得到语调识别结果;以及当获取的所述关键字识别结果为语音助手的信息时,获取预先与当前通话为语音助手的语音助手识别结果所匹配的通话操作指令,并停止后续对所述识别判断语音进行的语调识别和语义识别;

语义识别模块,用于根据若所述语调识别结果为非语音助手的信息,通过语义识别模型对所述识别判断语音进行语义识别,得到语义识别结果,将所述语义识别结果作为语音助手识别结果;以及当获取的所述语调识别结果为语音助手的信息时,获取预先与当前通话为语音助手的语音助手识别结果所匹配的通话操作指令,并停止后续对所述识别判断语音进行的语义识别;其中,所述语义识别模型包括:用于输入所述识别判断语音的输入层、用于对所述输入层的识别判断语音进行文本转换的文本转换层、用于将所述文本转换层中得到的文本进行分词处理的分词层、用于对所述分词层中得到的分词映射成浮点数向量的编码器层、用于对所述编码器层得到的编码进行解码的解码器层、用于对解码器层解码后得到的语音进行分析的分析层和将所述分析层得到的语意识别结果进行输出的输出层。

7.一种电子设备,其特征在于,所述电子设备包括:

至少一个处理器;以及,

与所述至少一个处理器通信连接的存储器;其中,

所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至5中任一所述的语音助手识别方法的步骤。

8.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5中任一所述的语音助手识别方法。