欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2018116321871
申请人: 西藏联萨智能科技有限公司
专利类型:发明专利
专利状态:已下证
专利领域: 乐器;声学
更新日期:2024-11-01
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种语音输出方法,其特征在于,所述语音输出方法包括以下步骤:在接收到启动朗读功能的指令时,获取待朗读文本,并通过训练好的语音合成模型合成所述待朗读文本对应的语音;

输出所述语音,以及,显示朗读速度控件;

侦测作用于所述朗读速度控件的触控操作;

在侦测到作用于所述朗读速度控件的触控操作时,根据侦测到的触控操作调整所述语音的输出速度;

其中,所述训练好的语音合成模型包括训练好的韵律分析模型和训练好的声学模型,所述通过训练好的语音合成模型合成所述待朗读文本对应的语音的步骤包括:通过训练好的韵律分析模型,提取所述待朗读文本对应的文本特征向量;

将所述文本特征向量输入至训练好的声学模型中,得到训练好的声学模型输出的声学特征向量;

根据所述声学特征向量,合成所述待朗读文本对应的语音;

所述根据所述声学特征向量,合成所述待朗读文本对应的语音的步骤包括:对所述声学特征向量进行反变换处理,得到所述声学特征向量对应的声音波形;

依次拼接所述声学特征向量对应的声音波形,合成所述待朗读文本对应的语音。

2.如权利要求1所述的语音输出方法,其特征在于,所述通过训练好的韵律分析模型,提取所述待朗读文本对应的文本特征向量的步骤包括:将所述待朗读文本输入至训练好的韵律分析模型中,进行分词处理和标注处理,得到分词结果和标注结果;

根据所述分词结果和标注结果提取所述待朗读文本对应的文本特征向量。

3.如权利要求1所述的语音输出方法,其特征在于,所述根据所述声学特征向量,合成所述待朗读文本对应的语音的步骤,还包括:根据所述声学特征向量,从预存真人语音片段库中,匹配所述声学特征向量对应的目标语音片段;

依次拼接匹配到的目标语音片段,合成所述待朗读文本对应的语音。

4.如权利要求1所述的语音输出方法,其特征在于,所述根据侦测到的触控操作调整所述语音的输出速度的步骤包括:确定侦测到的触控操作对应的变速倍率;

根据所述变速倍率调整所述语音的输出速度。

5.如权利要求4所述的语音输出方法,其特征在于,所述根据所述变速倍率调整所述语音的输出速度的步骤包括:从所述语音中提取待输出语音;

通过预设的傅里叶变换算法,按照所述变速倍率对所述待输出语音进行变速处理;

输出处理后的待输出语音。

6.如权利要求1所述的语音输出方法,其特征在于,所述在接收到启动朗读功能的指令时,获取待朗读文本,并通过训练好的语音合成模型合成所述待朗读文本对应的语音的步骤之前,包括:获取文本数据训练集,并根据所述文本数据训练集录制对应的语音数据训练集;

根据所述文本数据训练集训练韵律分析模型,以及,根据所述文本数据训练集和所述语音数据训练集训练声学模型,得到训练好的语音合成模型。

7.一种终端,其特征在于,所述终端包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的语音输出程序,所述语音输出程序被所述处理器执行时实现权利要求1至6中任一项所述的语音输出方法的步骤。

8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有语音输出程序,所述语音输出程序被处理器执行时实现如权利要求1至6中任一项所述的语音输出方法的步骤。