欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2018103614751
申请人: 百度在线网络技术(北京)有限公司
专利类型:发明专利
专利状态:已下证
专利领域: 乐器;声学
更新日期:2024-02-23
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种语音信号端点检测方法,其特征在于,包括:获取第一音频信号,所述第一音频信号中包括语音信号;

基于能量和过零率的第一语音活动检测VAD算法,以及基于深度学习的第二VAD算法中的一种从所述第一音频信号中检测所述语音信号的起点;

在检测到所述语音信号的起点后,采用所述第一VAD算法和所述第二VAD算法中的另一种检测所述语音信号的终点;

所述基于能量和过零率的第一语音活动检测VAD算法,以及基于深度学习的第二VAD算法中的一种从所述第一音频信号中检测所述语音信号的起点,包括:对所述第一音频信号进行降噪处理,获得第二音频信号;

采用所述第一VAD算法从所述第二音频信号中检测语音信号的起点。

2.根据权利要求1所述的方法,其特征在于,所述基于能量和过零率的第一语音活动检测VAD算法,以及基于深度学习的第二VAD算法中的一种从所述第一音频信号中检测所述语音信号的起点,包括:

基于深度学习的第二VAD算法从所述第一音频信号中检测所述语音信号的起点。

3.根据权利要求1所述的方法,其特征在于,所述基于能量和过零率的第一语音活动检测VAD算法,以及基于深度学习的第二VAD算法中的一种从所述第一音频信号中检测所述语音信号的起点,包括:

基于能量和过零率的第一VAD算法,从所述第一音频信号中检测所述语音信号的起点。

4.根据权利要求1‑3中任一项所述的方法,其特征在于,所述在检测到所述语音信号的起点后,采用所述第一VAD算法和所述第二VAD算法中的另一种检测所述语音信号的终点,包括:

在检测到语音信号的起点后,从所述起点的下一帧信号开始,采用所述第一VAD算法和所述第二VAD算法中的另一种检测所述语音信号的终点。

5.根据权利要求1‑3中任一项所述的方法,其特征在于,所述在检测到所述语音信号的起点后,采用所述第一VAD算法和所述第二VAD算法中的另一种检测所述语音信号的终点之后,所述方法还包括:

从所述音频信号中提取位于所述起点和所述终点之间的语音信号;

对所述语音信号进行语义分析处理,并基于语义分析处理的结果,执行相应的语音交互操作。

6.一种语音信号端点检测装置,其特征在于,包括:获取模块,用于获取第一音频信号,所述第一音频信号中包括语音信号;

起点检测模块,用于基于能量和过零率的第一语音活动检测VAD算法,以及基于深度学习的第二VAD算法中的一种从所述第一音频信号中检测所述语音信号的起点;

终点检测模块,用于在检测到所述语音信号的起点后,采用所述第一VAD算法和所述第二VAD算法中的另一种检测所述语音信号的终点;

所述起点检测模块,包括:

降噪子模块,用于对所述第一音频信号进行降噪处理,获得第二音频信号;

第三起点检测子模块,用于采用所述第一VAD算法从所述第二音频信号中检测语音信号的起点。

7.根据权利要求6所述的装置,其特征在于,所述起点检测模块,具体用于:基于深度学习的第二VAD算法从所述第一音频信号中检测所述语音信号的起点。

8.根据权利要求6所述的装置,其特征在于,所述起点检测模块,具体用于:基于能量和过零率的第一VAD算法,从所述第一音频信号中检测所述语音信号的起点。

9.根据权利要求6‑8中任一项所述的装置,其特征在于,所述终点检测模块,具体用于:在检测到语音信号的起点后,从所述起点的下一帧信号开始,采用所述第一VAD算法和所述第二VAD算法中的另一种检测所述语音信号的终点。

10.根据权利要求6‑8中任一项所述的装置,其特征在于,所述装置还包括:提取模块,用于从所述音频信号中提取位于所述起点和所述终点之间的语音信号;

执行模块,用于对所述语音信号进行语义分析处理,并基于语义分析处理的结果,执行相应的语音交互操作。

11.一种计算机设备,其特征在于,包括:一个或多个处理器;

一个或多个麦克风,用于采集音频信号;

存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1‑5中任一项所述的方法。

12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1‑5中任一项所述的方法。