知嘟嘟-专利交易平台_专利购买_专利出售-买专利,上嘟嘟

欢迎来到知嘟嘟！联系电话：13095918853 卖家免费入驻，海量在线求购！卖家免费入驻，海量在线求购！

嘟嘟会员

帮助中心网站地图

查出售查高校查求购查年费

我要发布

首页转移热力图Hot 专利交易委托购买高校专区科技服务专利求购年费查询行业资讯

联系电话：13095918853

知嘟嘟经纪人

语音合成方法及装置、计算机设备及可读介质

￥28000

专利号： 2018105651488

申请人：百度在线网络技术(北京)有限公司

专利类型：发明专利

专利状态：已下证

专利领域：乐器；声学

更新日期：2024-02-23

缴费截止日期：暂无

价格&联系人

年费信息

委托购买

专利简介

专利详情

委托购买说明

需准备材料

常见问题

摘要:

权利要求书:

1.一种语音合成方法，其特征在于，所述方法包括：

在语音拼接合成出现问题语音时，根据预先训练的时长预测模型和基频预测模型，预测所述问题语音对应的目标文本对应的每个音素的状态的时长以及每一帧的基频；

根据所述目标文本对应的所述每个音素的状态的时长以及每一帧的基频，使用预先训练的语音合成模型，合成所述目标文本对应的语音；其中，所述时长预测模型、所述基频预测模型和所述语音合成模型均基于语音拼接合成的音库训练得到。

2.根据权利要求1所述的方法，其特征在于，根据预先训练的时长预测模型和基频预测模型，预测目标文本对应的每个音素的状态的时长以及每一帧的基频之前，所述方法还包括：根据音库中的文本及对应的语音，训练所述时长预测模型、所述基频预测模型以及所述语音合成模型。

3.根据权利要求2所述的方法，其特征在于，根据音库中的文本及对应的语音，训练所述时长预测模型、所述基频预测模型以及所述语音合成模型，具体包括：从所述音库中的文本及对应的语音中，提取数个训练文本及对应的训练语音；

分别从所述数个训练语音中提取各所述训练语音中每个音素对应的状态的时长以及每一帧对应的基频；

根据各所述训练文本及对应的所述训练语音中的每个音素对应的状态的时长，训练所述时长预测模型；

根据各所述训练文本及对应的所述训练语音中的每一帧对应的基频，训练所述基频预测模型；

根据各所述训练文本、对应的各所述训练语音、对应的各所述训练语音中的每个音素对应的状态的时长以及每一帧对应的基频，训练所述语音合成模型。

4.根据权利要求2所述的方法，其特征在于，根据预先训练的时长预测模型和基频预测模型，预测目标文本对应的每个音素的状态的时长以及每一帧的基频之前，所述方法还包括：在使用所述音库进行语音拼接合成时，接收用户反馈的所述问题语音以及所述问题语音对应的所述目标文本。

5.根据权利要求2所述的方法，其特征在于，根据所述目标文本对应的所述每个音素的状态的时长以及每一帧的基频，使用预先训练的语音合成模型，合成所述目标文本对应的语音之后，所述方法还包括：将所述目标文本以及对应的合成的所述语音加入所述音库中。

6.根据权利要求1-5任一所述的方法，其特征在于，所述语音合成模型采用WaveNet模型。

7.一种语音合成装置，其特征在于，所述装置包括：

预测模块，用于在语音拼接合成出现问题语音时，根据预先训练的时长预测模型和基频预测模型，预测所述问题语音对应的目标文本对应的每个音素的状态的时长以及每一帧的基频；

合成模块，用于根据所述目标文本对应的所述每个音素的状态的时长以及每一帧的基频，使用预先训练的语音合成模型，合成所述目标文本对应的语音；其中，所述时长预测模型、所述基频预测模型和所述语音合成模型均基于语音拼接合成的音库训练得到。

8.根据权利要求7所述的装置，其特征在于，所述装置还包括：训练模块，用于根据音库中的文本及对应的语音，训练所述时长预测模型、所述基频预测模型以及所述语音合成模型。

9.根据权利要求8所述的装置，其特征在于，所述训练模块，具体用于：从所述音库中的文本及对应的语音中，提取数个训练文本及对应的训练语音；

分别从所述数个训练语音中提取各所述训练语音中每个音素对应的状态的时长以及每一帧对应的基频；

根据各所述训练文本及对应的所述训练语音中的每个音素对应的状态的时长，训练所述时长预测模型；

根据各所述训练文本及对应的所述训练语音中的每一帧对应的基频，训练所述基频预测模型；

10.根据权利要求8所述的装置，其特征在于，所述装置还包括：接收模块，用于在使用所述音库进行语音拼接合成时，接收用户反馈的所述问题语音以及所述问题语音对应的所述目标文本。

11.根据权利要求8所述的装置，其特征在于，所述装置还包括：添加模块，用于将所述目标文本以及对应的合成的所述语音加入所述音库中。

12.根据权利要求7-11任一所述的装置，其特征在于，所述语音合成模型采用WaveNet模型。

13.一种计算机设备，其特征在于，所述设备包括：

一个或多个处理器；

存储器，用于存储一个或多个程序；

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如权利要求1-6中任一所述的方法。

14.一种计算机可读介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1-6中任一所述的方法。

推荐专利

语音输出方法、终端及计算机可读存储介质

发明专利

￥14000

语音指令的挖掘方法和装置终端、计算机可读介质

发明专利

￥28000

语音助手识别方法、装置、设备及计算机可读存储介质

发明专利

￥39700

声学模型训练方法、装置、设备及计算机可读介质

发明专利

￥28000

我要求购

我不想找了，帮我找吧

您有专利需要变现?

我要出售

智能匹配需求，快速出售

摘要:

权利要求书:

知嘟嘟

友情链接

关于我们

联系我们