1.一种语音数据的韵律标注方法,其特征在于,包括以下步骤:
获取待标注语音数据的文本信息,并提取所述文本信息的第一文本特征信息和第二文本特征信息;
提取所述待标注语音数据的声学特征信息;
根据所述第一文本特征信息和韵律预测模型生成所述文本信息的候选韵律特征信息集合,其中,所述候选韵律特征信息集合包含N个候选韵律特征信息,N为大于1的正整数;
基于所述N个候选韵律特征信息、所述第二文本特征信息和声学预测模型生成所述文本信息的N个候选声学特征信息,其中,所述N个候选声学特征信息与所述N个候选韵律特征信息相对应;
分别计算每个候选声学特征信息与所述声学特征信息之间的相关值;
根据计算结果确定出最大相关值,并将最大相关值的候选声学特征所对应的候选韵律特征信息作为所述待标注语音数据的目标韵律特征信息;以及根据所述目标韵律特征信息对所述待标注语音数据的韵律特征进行标注。
2.如权利要求1所述的语音数据的韵律标注方法,其特征在于,基于所述N个候选韵律特征信息、所述第二文本特征信息和声学预测模型生成所述文本信息的N个候选声学特征信息,包括:针对每个候选韵律特征信息,将当前候选韵律特征信息和所述第二文本特征信息输入所述声学预测模型,通过所述声学预测模型对所述文本信息进行声学预测,以生成所述文本信息的当前候选声学特征信息。
3.如权利要求1所述的语音数据的韵律标注方法,其特征在于,所述根据所述第一文本特征信息和韵律预测模型生成所述文本信息的候选韵律特征信息集合,包括:将所述第一文本特征信息输入所述韵律预测模型,通过所述韵律预测模型对所述文件信息进行韵律预测,以生成所述文本信息的候选韵律特征信息集合。
4.如权利要求1-3所述的语音数据的韵律标注方法,其特征在于,所述第一文本特征信息包括词性和词面,所述第二文本特征信息包括声韵母和声调,所述目标韵律特征信息包括韵律停顿等级。
5.一种语音数据的韵律标注装置,其特征在于,包括:
获取模块,用于获取待标注语音数据的文本信息;
第一提取模块,用于提取所述文本信息的第一文本特征信息和第二文本特征信息;
第二提取模块,用于提取所述待标注语音数据的声学特征信息;
第一生成模块,用于根据所述第一文本特征信息和韵律预测模型生成所述文本信息的候选韵律特征信息集合,其中,所述候选韵律特征信息集合包含N个候选韵律特征信息,N为大于1的正整数;
第二生成模块,用于基于所述N个候选韵律特征信息、所述第二文本特征信息和声学预测模型生成所述文本信息的N个候选声学特征信息,其中,所述N个候选声学特征信息与所述N个候选韵律特征信息相对应;
计算模块,用于分别计算每个候选声学特征信息与所述声学特征信息之间的相关值;
确定模块,用于根据计算结果确定出最大相关值,并将最大相关值的候选声学特征所对应的候选韵律特征信息作为所述待标注语音数据的目标韵律特征信息;以及标注模块,用于根据所述目标韵律特征信息对所述待标注语音数据的韵律特征进行标注。
6.如权利要求5所述的语音数据的韵律标注装置,其特征在于,所述第二生成模块,具体用于:针对每个候选韵律特征信息,将当前候选韵律特征信息和所述第二文本特征信息输入所述声学预测模型,通过所述声学预测模型对所述文本信息进行声学预测,以生成所述文本信息的当前候选声学特征信息。
7.如权利要求5所述的语音数据的韵律标注装置,其特征在于,所述第一生成模块,具体用于:将所述第一文本特征信息输入所述韵律预测模型,通过所述韵律预测模型对所述文件信息进行韵律预测,以生成所述文本信息的候选韵律特征信息集合。
8.如权利要求5-7所述的语音数据的韵律标注装置,其特征在于,所述第一文本特征信息包括词性和词面,所述第二文本特征信息包括声韵母和声调,所述目标韵律特征信息包括韵律停顿等级。