1.一种韵律结构预测方法,其特征在于,包括:对无标注数据进行学习获得词语的词向量;
对所述词语的词向量进行聚类,获得所述词向量的聚类特征;
将所述词向量的聚类特征加入从标注数据提取的特征集合中;
对加入所述聚类特征的特征集合进行训练获得带有聚类特征的韵律结构预测模型;
通过所述韵律结构预测模型进行韵律结构预测。
2.根据权利要求1所述的方法,其特征在于,所述对无标注数据进行学习获得词语的词向量包括:通过类神经网络语音模型以无监督学习的方式对无标注数据进行学习获得词语的词向量。
3.根据权利要求1所述的方法,其特征在于,所述对所述词语的词向量进行聚类,获得所述词向量的聚类特征包括:对所述词语的词向量进行聚类;
获得聚类后的每个类别的类中心向量;
计算给定的词语的词向量与所有类中心向量的余弦相似度;
判断所述余弦相似度中最大的余弦相似度是否大于预先设置的阈值;
如果是,则确定所述给定的词语的词向量的聚类特征为所述最大的余弦相似度所对应的类别符号。
4.根据权利要求1-3任意一项所述的方法,其特征在于,所述对加入所述聚类特征的特征集合进行训练获得带有聚类特征的韵律结构预测模型包括:通过监督学习的方式对加入所述聚类特征的特征集合进行训练获得带有聚类特征的韵律结构预测模型。
5.一种韵律结构预测装置,其特征在于,包括:学习模块,用于对无标注数据进行学习获得词语的词向量;
聚类模块,用于对所述学习模块获得的所述词语的词向量进行聚类,获得所述词向量的聚类特征;
添加模块,用于将所述聚类模块获得的所述词向量的聚类特征加入从标注数据提取的特征集合中;
训练模块,用于对加入所述聚类特征的特征集合进行训练获得带有聚类特征的韵律结构预测模型;
预测模块,用于通过所述训练模块获得的韵律结构预测模型进行韵律结构预测。
6.根据权利要求5所述的装置,其特征在于,所述学习模块,具体用于通过类神经网络语音模型以无监督学习的方式对无标注数据进行学习获得词语的词向量。
7.根据权利要求5所述的装置,其特征在于,所述聚类模块包括:词向量聚类子模块,用于对所述词语的词向量进行聚类;
获得子模块,用于获得所述词向量聚类子模块聚类后的每个类别的类中心向量;
计算子模块,用于计算给定的词语的词向量与所述获得子模块获得的所有类中心向量的余弦相似度;
判断子模块,用于判断所述计算子模块获得的余弦相似度中最大的余弦相似度是否大于预先设置的阈值;
特征确定子模块,用于当所述判断子模块确定所述最大的余弦相似度大于预先设置的阈值时,确定所述给定的词语的词向量的聚类特征为所述最大的余弦相似度所对应的类别符号。
8.根据权利要求5-7任意一项所述的装置,其特征在于,所述训练模块,具体用于通过监督学习的方式对加入所述聚类特征的特征集合进行训练获得带有聚类特征的韵律结构预测模型。