知嘟嘟-专利交易平台_专利购买_专利出售-买专利,上嘟嘟

欢迎来到知嘟嘟！联系电话：13095918853 卖家免费入驻，海量在线求购！卖家免费入驻，海量在线求购！

嘟嘟会员

帮助中心网站地图

查出售查高校查求购查年费

我要发布

首页转移热力图Hot 专利交易委托购买高校专区科技服务专利求购年费查询行业资讯

联系电话：13095918853

知嘟嘟经纪人

一种声学模型训练方法和装置、计算机设备、存储介质

￥28000

专利号： 2017104587206

申请人：百度在线网络技术(北京)有限公司

专利类型：发明专利

专利状态：已下证

专利领域：乐器；声学

更新日期：2024-02-23

缴费截止日期：暂无

价格&联系人

年费信息

委托购买

专利简介

专利详情

委托购买说明

需准备材料

常见问题

摘要:

权利要求书:

1.一种声学模型训练方法，其特征在于，包括：

获取有监督语音数据和无监督语音数据，其中，有监督语音数据为带有人工标注的语音数据，无监督语音数据为带有机器标注的语音数据；

从所述有监督语音数据和无监督语音数据中提取语音特征；

利用深度学习的网络结构，对所述有监督语音数据和无监督语音数据的语音特征分别进行有监督学习任务和无监督学习任务的多任务学习，以训练并获得声学模型。

2.根据权利要求1所述的方法，其特征在于，所述深度学习的网络结构包括输入层、至少一层隐含层和输出层；

其中，输入层为有监督学习任务和无监督学习任务共享；

至少一层隐含层为有监督学习任务和无监督学习任务共享，由有监督语音数据和无监督语音数据共同进行训练；

输出层包括有监督学习任务输出层和无监督学习任务输出层。

3.根据权利要求1所述的方法，其特征在于，所述深度学习的网络结构包括输入层、至少一层隐含层和输出层；

其中，输入层为有监督学习任务和无监督学习任务共享；

所述至少一层隐含层中的第一部分隐含层为有监督学习任务和无监督学习任务共享，第二部分隐含层分别由有监督学习任务和无监督学习任务单独进行训练调整；

输出层包括有监督学习任务输出层和无监督学习任务输出层。

4.根据权利要求2或3所述的方法，其特征在于，

在模型训练完成后，最终获得的声学模型是丢弃由无监督学习任务训练调整的隐含层参数和/或输出层参数后得到的声学模型，以便在推理阶段只保留声学模型中有监督学习任务部分的输出结果；或者在模型训练完成后，最终获得的声学模型是保留全部的模型参数得到的声学模型，以便在推理阶段同时保留有监督学习任务的输出结果和无监督学习任务的输出结果，并进行融合，作为最终的输出结果。

5.根据权利要求1所述的方法，其特征在于，对所述有监督语音数据和无监督语音数据的语音特征分别进行有监督学习任务和无监督学习任务的多任务学习，以训练并获得声学模型，包括：对所述有监督语音数据和无监督语音数据的语音特征分别进行有监督学习任务和无监督学习任务的多任务学习，以按照预先对有监督学习任务和无监督学习任务设置的各自的权重来进行训练并获得声学模型。

6.根据权利要求1所述的方法，其特征在于，在所述获取有监督语音数据和无监督语音数据之后，并在所述提取语音特征之前，所述方法还包括：通过置信度过滤手段对所述无监督语音数据进行过滤和筛选。

7.一种声学模型训练装置，其特征在于，包括：

数据获取模块，用于获取有监督语音数据和无监督语音数据，其中，有监督语音数据为带有人工标注的语音数据，无监督语音数据为带有机器标注的语音数据；

特征提取模块，用于从所述有监督语音数据和无监督语音数据中提取语音特征；

模型训练模块，用于利用深度学习的网络结构，对所述有监督语音数据和无监督语音数据的语音特征分别进行有监督学习任务和无监督学习任务的多任务学习，以训练并获得声学模型。

8.根据权利要求7所述的装置，其特征在于，所述深度学习的网络结构包括输入层、至少一层隐含层和输出层；

其中，输入层为有监督学习任务和无监督学习任务共享；

至少一层隐含层为有监督学习任务和无监督学习任务共享，由有监督语音数据和无监督语音数据共同进行训练；

输出层包括有监督学习任务输出层和无监督学习任务输出层。

9.根据权利要求7所述的装置，其特征在于，所述深度学习的网络结构包括输入层、至少一层隐含层和输出层；

其中，输入层为有监督学习任务和无监督学习任务共享；

输出层包括有监督学习任务输出层和无监督学习任务输出层。