欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2015104776529
申请人: 百度在线网络技术(北京)有限公司
专利类型:发明专利
专利状态:已下证
专利领域: 乐器;声学
更新日期:2024-02-23
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种韵律层级预测模型的生成方法,其特征在于,包括:根据精标数据集生成初始的韵律层级预测模型;

收集语音及对应的文本数据,检测语音中的特征信息,并将所述特征信息加入文本数据的对应位置;

根据所述初始的韵律层级预测模型,对加入特征信息的文本数据进行韵律层级预测,得到初始的韵律层级预测结果;

根据所述精标数据集和所述初始的韵律层级预测结果进行训练,生成更新后的韵律层级预测模型,所述更新后的韵律层级预测模型用于语音合成时的韵律层级预测。

2.根据权利要求1所述的方法,其特征在于,所述特征信息是停顿信息。

3.根据权利要求2所述的方法,其特征在于,所述检测语音中的特征信息,并将所述特征信息加入文本数据的对应位置,包括:采用人工或者自动的方式,检测语音中的特征信息,并将所述特征信息加入文本数据的对应位置。

4.根据权利要求3所述的方法,其特征在于,所述自动的方式包括:基于文本数据与语音强制对齐的结果;或者,基于语音识别解码的最优序列;或者,

基于幅度的简单检测。

5.根据权利要求1-4任一项所述的方法,其特征在于,所述收集语音及对应的文本数据,包括:收集海量的语音及对应的文本数据,所述海量的语音是指数量大于预设值的语音。

6.一种韵律层级预测方法,其特征在于,获取文本处理后的输入文本;

获取韵律层级预测模型;

根据所述韵律层级预测模型,对所述文本处理后的输入文本进行韵律层级预测,得到韵律层级预测结果;

其中,所述韵律层级预测模型采用如权利要求1-5任一项所述的方法生成。

7.一种韵律层级预测模型的生成装置,其特征在于,包括:第一生成模块,用于根据精标数据集生成初始的韵律层级预测模型;

处理模块,用于收集语音及对应的文本数据,检测语音中的特征信息,并将所述特征信息加入文本数据的对应位置;

预测模块,用于根据所述初始的韵律层级预测模型,对加入特征信息的文本数据进行韵律层级预测,得到初始的韵律层级预测结果;

第二生成模块,用于根据所述精标数据集和所述初始的韵律层级预测结果进行训练,生成更新后的韵律层级预测模型,所述更新后的韵律层级预测模型用于语音合成时的韵律层级预测。

8.根据权利要求7所述的装置,其特征在于,所述特征信息是停顿信息。

9.根据权利要求8所述的装置,其特征在于,所述处理模块用于检测语音中的特征信息,并将所述特征信息加入文本数据的对应位置,包括:采用人工或者自动的方式,检测语音中的特征信息,并将所述特征信息加入文本数据的对应位置。

10.根据权利要求9所述的装置,其特征在于,所述自动的方式包括:基于文本数据与语音强制对齐的结果;或者,基于语音识别解码的最优序列;或者,

基于幅度的简单检测。

11.根据权利要求7-10任一项所述的装置,其特征在于,所述处理模块用于收集语音及对应的文本数据,包括:收集海量的语音及对应的文本数据,所述海量的语音是指数量大于预设值的语音。

12.一种韵律层级预测装置,其特征在于,包括:第一获取模块,用于获取文本处理后的输入文本;

第二获取模块,用于获取韵律层级预测模型;

预测模块,用于根据所述韵律层级预测模型,对所述文本处理后的输入文本进行韵律层级预测,得到韵律层级预测结果;

其中,所述韵律层级预测模型采用如权利要求1-5任一项所述的方法生成。