欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2015103374307
申请人: 百度在线网络技术(北京)有限公司
专利类型:发明专利
专利状态:已下证
专利领域: 乐器;声学
更新日期:2024-02-23
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种用于语音合成的韵律模型训练方法,其特征在于,包括以下步骤:S1、从训练语料文本中提取分词对应的文本特征和标记特征;

S2、基于同义词词林对所述训练语料文本中的分词进行泛化;以及S3、根据所述文本特征、所述标记特征以及泛化后的分词,对所述韵律模型进行训练。

2.如权利要求1所述的方法,其特征在于,所述根据所述文本特征、所述标记特征以及泛化后的分词,对所述韵律模型进行训练,具体包括:通过目标函数对所述韵律模型进行训练,以获得转移函数的权重参数和状态函数的权重参数。

3.一种使用如权利要求1或2所述的韵律模型进行语音合成的方法,其特征在于,包括以下步骤:S4、从待预测文本中提取文本特征,并将所述文本特征输入所述韵律模型;

S5、根据所述韵律模型对所述待预测文本进行韵律预测;

S6、进一步对所述待预测文本进行声学预测,以生成声学参数序列;以及S7、对所述声学参数序列进行拼接,以生成语音合成结果。

4.如权利要求3所述的方法,其特征在于,所述根据所述韵律模型对所述待预测文本进行韵律预测,具体包括:根据转移函数和状态函数,判断所述文本特征是否存在对应的转移函数的权重参数和状态函数的权重参数,若存在,则获取所述待预测文本对应的韵律停顿层级。

5.一种用于语音合成的韵律模型训练装置,包括:提取模块,用于从训练语料文本中提取分词对应的文本特征和标记特征,其特征在于,还包括:泛化模块,用于基于同义词词林对所述训练语料文本中的分词进行泛化;以及训练模块,用于根据所述文本特征、所述标记特征以及泛化后的分词,对所述韵律模型进行训练。

6.如权利要求5所述的装置,其特征在于,所述训练模块,具体用于:通过目标函数对所述韵律模型进行训练,以获得转移函数的权重参数和状态函数的权重参数。

7.一种使用如权利要求5或6所述的韵律模型进行语音合成的装置,其特征在于,包括:分析模块,用于从待预测文本中提取文本特征,并将所述文本特征输入所述韵律模型;

韵律预测模块,用于根据所述韵律模型对所述待预测文本进行韵律预测;

声学预测模块,用于进一步对所述待预测文本进行声学预测,以生成声学参数序列;以及生成模块,用于对所述声学参数序列进行拼接,以生成语音合成结果。

8.如权利要求7所述的装置,其特征在于,所述韵律预测模块,具体用于:根据转移函数和状态函数,判断所述文本特征是否存在对应的转移函数的权重参数和状态函数的权重参数,若存在,则获取所述待预测文本对应的韵律停顿层级。