知嘟嘟-专利交易平台_专利购买_专利出售-买专利,上嘟嘟

欢迎来到知嘟嘟！联系电话：13095918853 卖家免费入驻，海量在线求购！卖家免费入驻，海量在线求购！

嘟嘟会员

帮助中心网站地图

查出售查高校查求购查年费

我要发布

首页转移热力图Hot 专利交易委托购买高校专区科技服务专利求购年费查询行业资讯

联系电话：13095918853

知嘟嘟经纪人

语音信号端点检测方法、装置、设备及存储介质

￥28000

专利号： 2018103614751

申请人：百度在线网络技术(北京)有限公司

专利类型：发明专利

专利状态：已下证

专利领域：乐器；声学

更新日期：2024-02-23

缴费截止日期：暂无

价格&联系人

年费信息

委托购买

专利简介

专利详情

委托购买说明

需准备材料

常见问题

摘要:

权利要求书:

1.一种语音信号端点检测方法，其特征在于，包括：获取第一音频信号，所述第一音频信号中包括语音信号；

基于能量和过零率的第一语音活动检测VAD算法，以及基于深度学习的第二VAD算法中的一种从所述第一音频信号中检测所述语音信号的起点；

在检测到所述语音信号的起点后，采用所述第一VAD算法和所述第二VAD算法中的另一种检测所述语音信号的终点。

2.根据权利要求1所述的方法，其特征在于，所述基于能量和过零率的第一语音活动检测VAD算法，以及基于深度学习的第二VAD算法中的一种从所述第一音频信号中检测所述语音信号的起点，包括：基于深度学习的第二VAD算法从所述第一音频信号中检测所述语音信号的起点。

3.根据权利要求1所述的方法，其特征在于，所述基于能量和过零率的第一语音活动检测VAD算法，以及基于深度学习的第二VAD算法中的一种从所述第一音频信号中检测所述语音信号的起点，包括：基于能量和过零率的第一VAD算法，从所述第一音频信号中检测所述语音信号的起点。

4.根据权利要求1所述的方法，其特征在于，所述基于能量和过零率的第一语音活动检测VAD算法，以及基于深度学习的第二VAD算法中的一种从所述第一音频信号中检测所述语音信号的起点，包括：检测所述第一音频信号的噪声水平；

若所述第一音频信号的噪声水平小于预设第一阈值，则基于第一VAD算法检测所述第一音频信号中语音信号的起点；

若所述第一音频信号的噪声水平高于预设第一阈值，则基于第二VAD算法检测所述第一音频信号中语音信号的起点。

5.根据权利要求1所述的方法，其特征在于，所述基于能量和过零率的第一语音活动检测VAD算法，以及基于深度学习的第二VAD算法中的一种从所述第一音频信号中检测所述语音信号的起点，包括：对所述第一音频信号进行降噪处理，获得第二音频信号；

采用所述第一VAD算法从所述第二音频信号中检测语音信号的起点。

6.根据权利要求1-5中任一项所述的方法，其特征在于，所述在检测到所述语音信号的起点后，采用所述第一VAD算法和所述第二VAD算法中的另一种检测所述语音信号的终点，包括：在检测到语音信号的起点后，从所述起点的下一帧信号开始，采用所述第一VAD算法和所述第二VAD算法中的另一种检测所述语音信号的终点。

7.根据权利要求1-5中任一项所述的方法，其特征在于，所述在检测到所述语音信号的起点后，采用所述第一VAD算法和所述第二VAD算法中的另一种检测所述语音信号的终点之后，所述方法还包括：从所述音频信号中提取位于所述起点和所述终点之间的语音信号；

对所述语音信号进行语义分析处理，并基于语义分析处理的结果，执行相应的语音交互操作。

8.一种语音信号端点检测装置，其特征在于，包括：获取模块，用于获取第一音频信号，所述第一音频信号中包括语音信号；

起点检测模块，用于基于能量和过零率的第一语音活动检测VAD算法，以及基于深度学习的第二VAD算法中的一种从所述第一音频信号中检测所述语音信号的起点；

终点检测模块，用于在检测到所述语音信号的起点后，采用所述第一VAD算法和所述第二VAD算法中的另一种检测所述语音信号的终点。

9.根据权利要求8所述的装置，其特征在于，所述起点检测模块，具体用于：基于深度学习的第二VAD算法从所述第一音频信号中检测所述语音信号的起点。

10.根据权利要求8所述的装置，其特征在于，所述起点检测模块，具体用于：基于能量和过零率的第一VAD算法，从所述第一音频信号中检测所述语音信号的起点。

11.根据权利要求8所述的装置，其特征在于，所述起点检测模块，包括：检测子模块，用于检测所述第一音频信号的噪声水平；

第一起点检测子模块，用于在所述第一音频信号的噪声水平小于预设第一阈值时，基于第一VAD算法检测所述第一音频信号中语音信号的起点；

第二起点检测子模块，用于在所述第一音频信号的噪声水平高于预设第一阈值时，基于第二VAD算法检测所述第一音频信号中语音信号的起点。

12.根据权利要求8所述的装置，其特征在于，所述起点检测模块，包括：降噪子模块，用于对所述第一音频信号进行降噪处理，获得第二音频信号；

第三起点检测子模块，用于采用所述第一VAD算法从所述第二音频信号中检测语音信号的起点。