欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2018114736288
申请人: 百度在线网络技术(北京)有限公司
专利类型:发明专利
专利状态:已下证
专利领域: 乐器;声学
更新日期:2024-02-23
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种声学模型训练方法,其特征在于,包括:对输入的语音进行识别,得到所述语音数据对应的文本;

当检测到对所述文本的修改操作时,获取修改数据;

将所述修改数据作为新的训练数据和原始训练数据一起输入至声学模型进行训练。

2.根据权利要求1所述的方法,其特征在于,所述当检测到对所述文本的修改操作时,获取修改数据,包括:检测文本的修改内容,剔除修改数据中对标点符号的修改数据;

检测文本中文字的修改后文本字数,保留与修改前文本字数相同的修改数据。

3.根据权利要求1所述的方法,其特征在于,所述将所述修改数据作为新的训练数据和原始训练数据一起输入至声学模型进行训练包括:从声学模型的原始数据输入层输入原始训练数据;

从声学模型的新数据输入层输入新的训练数据;

在声学模型的隐层中对原始训练数据和新的训练数据进行训练;

从声学模型的原始数据输出层输出原始训练数据的识别标签;

从声学模型的新数据输出层输出新训练数据的识别标签。

4.根据权利要求1所述的方法,其特征在于,所述新的训练数据和原始训练数据的数据量比例为:1:1~1:2之间。

5.一种声学模型训练装置,其特征在于,包括:识别模块,用于对输入的语音进行识别,得到所述语音数据对应的文本;

修改检测模块,用于当检测到对所述文本的修改操作时,获取修改数据;

训练模块,用于将所述修改数据作为新的训练数据和原始训练数据一起输入至声学模型进行训练。

6.根据权利要求5所述的装置,其特征在于,所述修改检测模块包括:内容检测子模块,用于检测文本的修改内容,剔除修改数据中对标点符号的修改数据;

字数检测子模块,用于检测文本中文字的修改后文本字数,保留与修改前文本字数相同的修改数据。

7.根据权利要求5所述的装置,其特征在于,所述训练模块包括:原始数据输入子模块,用于从声学模型的原始数据输入层输入原始训练数据;

新数据输入子模块,用于从声学模型的新数据输入层输入新的训练数据;

联合训练子模块,用于在声学模型的隐层中对原始训练数据和新的训练数据进行训练;

原始数据输出子模块,用于从声学模型的原始数据输出层输出原始训练数据的识别标签;

新数据输出子模块,用于从声学模型的新数据输出层输出新训练数据的识别标签。

8.根据权利要求5所述的装置,其特征在于,所述新的训练数据和原始训练数据的数据量比例为:1:1~1:2之间。

9.一种声学模型训练设备,其特征在于,所述设备包括:一个或多个处理器;

存储装置,用于存储一个或多个程序;

当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1-4中任一所述的声学模型训练方法。

10.一种计算机可读介质,其存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-4中任一所述的声学模型训练方法。