欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2018107584350
申请人: 北京小蓦机器人技术有限公司
专利类型:发明专利
专利状态:已下证
专利领域: 乐器;声学
更新日期:2024-08-26
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种语音识别方法,应用于第一终端中,其特征在于,所述方法包括:采集待识别的目标语音;

获取所述目标语音的声学特征;

调用目标识别模型,将所述声学特征输入至所述目标识别模型中,输出所述目标语音对应的行为意图标签,所述目标识别模型用于根据任一语音的声学特征识别所述语音对应的行为意图;

其中,所述调用目标识别模型之前,该方法还包括:获取至少一个语音训练样本的声学特征和每个语音训练样本对应的行为意图标签;

基于所述至少一个语音训练样本的声学特征和所述每个语音训练样本对应的行为意图标签,对待训练的识别模型进行训练,得到所述目标识别模型;

其中,获取每个语音训练样本对应的行为意图标签,包括:获取至少一个语音;

确定所述至少一个语音中每个语音对应的行为操作,其中,该每个语音对应的行为操作包括以下至少任一项:-该每个语音对应的行为操作是在接收到针对该每个语音触发的操作指令时所执行的;-该每个语音对应的行为操作还可以是在采集到针对该每个语音录入的标准控制语音时所执行的;

生成每个行为操作对应的行为意图标签;

将所述至少一个语音确定为所述至少一个语音训练样本,以及将生成的每个行为意图标签确定为对应的语音训练样本的行为意图标签;

所述获取至少一个语音之前,还包括:

根据所述每个语音的声纹特征,查询所述至少一个语音是否均来自目标用户;

当所述至少一个语音均来自所述目标用户时,执行所述获取至少一个语音的操作;

所述基于所述至少一个语音训练样本的声学特征和所述每个语音训练样本对应的行为意图标签,对待训练的识别模型进行训练,得到所述目标识别模型之后,还包括:向第二终端分享所述目标识别模型,所述第二终端是指与所述第一终端具有关联关系的终端。

2.如权利要求1所述的方法,其特征在于,所述根据所述每个语音的声纹特征,查询所述至少一个语音是否均来自目标用户,包括:确定所述每个语音的声纹特征与预设声纹特征之间的差异值;

当所述每个语音的声纹特征与所述预设声纹特征之间的差异值均小于预设阈值时,确定所述至少一个语音均来自所述目标用户。

3.一种语音识别装置,应用于第一终端中,其特征在于,所述装置包括:采集模块,用于采集待识别的目标语音;

第一获取模块,用于获取所述目标语音的声学特征;

调用模块,用于调用目标识别模型,将所述声学特征输入至所述目标识别模型中,输出所述目标语音对应的行为意图标签,所述目标识别模型用于根据任一语音的声学特征识别所述语音对应的行为意图;

所述装置还包括:

第二获取模块,用于获取至少一个语音训练样本的声学特征和每个语音训练样本对应的行为意图标签;

训练模块,用于基于所述至少一个语音训练样本的声学特征和所述每个语音训练样本对应的行为意图标签,对待训练的识别模型进行训练,得到所述目标识别模型;

所述第二获取模块用于:

获取至少一个语音;

确定所述至少一个语音中每个语音对应的行为操作;

生成每个行为操作对应的行为意图标签;

将所述至少一个语音确定为所述至少一个语音训练样本,以及将生成的每个行为意图标签确定为对应的语音训练样本的行为意图标签;

所述第二获取模块还用于:

根据所述每个语音的声纹特征,查询所述至少一个语音是否均来自目标用户,所述目标用户是指与所述第一终端具有关联关系的用户;

当所述至少一个语音均来自所述目标用户时,执行所述获取至少一个语音的操作;

所述装置还包括:

分享模块,用于向第二终端分享所述目标识别模型,所述第二终端是指与所述第一终端具有关联关系的终端。

4.如权利要求3所述的装置,其特征在于,所述第二获取模块还用于:确定所述每个语音的声纹特征与预设声纹特征之间的差异值;

当所述每个语音的声纹特征与所述预设声纹特征之间的差异值均小于预设阈值时,确定所述至少一个语音均来自所述目标用户。

5.一种计算机可读存储介质,所述计算机可读存储介质上存储有指令,其特征在于,所述指令被处理器执行时实现权利要求1-2中任一项所述的方法。

6.一种计算设备,包括:

一个或多个处理器;

存储器,用于存储一个或多个程序,

当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行如权利要求1-2中任一项所述的方法。