1.一种韵律层级预测模型的生成方法,其特征在于,包括:根据精标数据集生成初始的韵律层级预测模型;
收集语音及对应的文本数据,检测语音中的特征信息,并将所述特征信息加入文本数据的对应位置;
根据所述初始的韵律层级预测模型,对加入特征信息的文本数据进行韵律层级预测,得到初始的韵律层级预测结果;
根据所述精标数据集和所述初始的韵律层级预测结果进行训练,生成更新后的韵律层级预测模型,所述更新后的韵律层级预测模型用于语音合成时的韵律层级预测。
2.根据权利要求1所述的方法,其特征在于,所述特征信息是停顿信息。
3.根据权利要求2所述的方法,其特征在于,所述检测语音中的特征信息,并将所述特征信息加入文本数据的对应位置,包括:采用人工或者自动的方式,检测语音中的特征信息,并将所述特征信息加入文本数据的对应位置。
4.根据权利要求3所述的方法,其特征在于,所述自动的方式包括:基于文本数据与语音强制对齐的结果;或者,基于语音识别解码的最优序列;或者,
基于幅度的简单检测。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述收集语音及对应的文本数据,包括:收集海量的语音及对应的文本数据,所述海量的语音是指数量大于预设值的语音。
6.一种韵律层级预测方法,其特征在于,获取文本处理后的输入文本;
获取韵律层级预测模型;
根据所述韵律层级预测模型,对所述文本处理后的输入文本进行韵律层级预测,得到韵律层级预测结果;
其中,所述韵律层级预测模型采用如权利要求1-5任一项所述的方法生成。
7.一种韵律层级预测模型的生成装置,其特征在于,包括:第一生成模块,用于根据精标数据集生成初始的韵律层级预测模型;
处理模块,用于收集语音及对应的文本数据,检测语音中的特征信息,并将所述特征信息加入文本数据的对应位置;
预测模块,用于根据所述初始的韵律层级预测模型,对加入特征信息的文本数据进行韵律层级预测,得到初始的韵律层级预测结果;
第二生成模块,用于根据所述精标数据集和所述初始的韵律层级预测结果进行训练,生成更新后的韵律层级预测模型,所述更新后的韵律层级预测模型用于语音合成时的韵律层级预测。
8.根据权利要求7所述的装置,其特征在于,所述特征信息是停顿信息。
9.根据权利要求8所述的装置,其特征在于,所述处理模块用于检测语音中的特征信息,并将所述特征信息加入文本数据的对应位置,包括:采用人工或者自动的方式,检测语音中的特征信息,并将所述特征信息加入文本数据的对应位置。
10.根据权利要求9所述的装置,其特征在于,所述自动的方式包括:基于文本数据与语音强制对齐的结果;或者,基于语音识别解码的最优序列;或者,
基于幅度的简单检测。
11.根据权利要求7-10任一项所述的装置,其特征在于,所述处理模块用于收集语音及对应的文本数据,包括:收集海量的语音及对应的文本数据,所述海量的语音是指数量大于预设值的语音。
12.一种韵律层级预测装置,其特征在于,包括:第一获取模块,用于获取文本处理后的输入文本;
第二获取模块,用于获取韵律层级预测模型;
预测模块,用于根据所述韵律层级预测模型,对所述文本处理后的输入文本进行韵律层级预测,得到韵律层级预测结果;
其中,所述韵律层级预测模型采用如权利要求1-5任一项所述的方法生成。