1.一种语音信号端点检测方法,其特征在于,包括:获取第一音频信号,所述第一音频信号中包括语音信号;
基于能量和过零率的第一语音活动检测VAD算法,以及基于深度学习的第二VAD算法中的一种从所述第一音频信号中检测所述语音信号的起点;
在检测到所述语音信号的起点后,采用所述第一VAD算法和所述第二VAD算法中的另一种检测所述语音信号的终点;
所述基于能量和过零率的第一语音活动检测VAD算法,以及基于深度学习的第二VAD算法中的一种从所述第一音频信号中检测所述语音信号的起点,包括:对所述第一音频信号进行降噪处理,获得第二音频信号;
采用所述第一VAD算法从所述第二音频信号中检测语音信号的起点。
2.根据权利要求1所述的方法,其特征在于,所述基于能量和过零率的第一语音活动检测VAD算法,以及基于深度学习的第二VAD算法中的一种从所述第一音频信号中检测所述语音信号的起点,包括:
基于深度学习的第二VAD算法从所述第一音频信号中检测所述语音信号的起点。
3.根据权利要求1所述的方法,其特征在于,所述基于能量和过零率的第一语音活动检测VAD算法,以及基于深度学习的第二VAD算法中的一种从所述第一音频信号中检测所述语音信号的起点,包括:
基于能量和过零率的第一VAD算法,从所述第一音频信号中检测所述语音信号的起点。
4.根据权利要求1‑3中任一项所述的方法,其特征在于,所述在检测到所述语音信号的起点后,采用所述第一VAD算法和所述第二VAD算法中的另一种检测所述语音信号的终点,包括:
在检测到语音信号的起点后,从所述起点的下一帧信号开始,采用所述第一VAD算法和所述第二VAD算法中的另一种检测所述语音信号的终点。
5.根据权利要求1‑3中任一项所述的方法,其特征在于,所述在检测到所述语音信号的起点后,采用所述第一VAD算法和所述第二VAD算法中的另一种检测所述语音信号的终点之后,所述方法还包括:
从所述音频信号中提取位于所述起点和所述终点之间的语音信号;
对所述语音信号进行语义分析处理,并基于语义分析处理的结果,执行相应的语音交互操作。
6.一种语音信号端点检测装置,其特征在于,包括:获取模块,用于获取第一音频信号,所述第一音频信号中包括语音信号;
起点检测模块,用于基于能量和过零率的第一语音活动检测VAD算法,以及基于深度学习的第二VAD算法中的一种从所述第一音频信号中检测所述语音信号的起点;
终点检测模块,用于在检测到所述语音信号的起点后,采用所述第一VAD算法和所述第二VAD算法中的另一种检测所述语音信号的终点;
所述起点检测模块,包括:
降噪子模块,用于对所述第一音频信号进行降噪处理,获得第二音频信号;
第三起点检测子模块,用于采用所述第一VAD算法从所述第二音频信号中检测语音信号的起点。
7.根据权利要求6所述的装置,其特征在于,所述起点检测模块,具体用于:基于深度学习的第二VAD算法从所述第一音频信号中检测所述语音信号的起点。
8.根据权利要求6所述的装置,其特征在于,所述起点检测模块,具体用于:基于能量和过零率的第一VAD算法,从所述第一音频信号中检测所述语音信号的起点。
9.根据权利要求6‑8中任一项所述的装置,其特征在于,所述终点检测模块,具体用于:在检测到语音信号的起点后,从所述起点的下一帧信号开始,采用所述第一VAD算法和所述第二VAD算法中的另一种检测所述语音信号的终点。
10.根据权利要求6‑8中任一项所述的装置,其特征在于,所述装置还包括:提取模块,用于从所述音频信号中提取位于所述起点和所述终点之间的语音信号;
执行模块,用于对所述语音信号进行语义分析处理,并基于语义分析处理的结果,执行相应的语音交互操作。
11.一种计算机设备,其特征在于,包括:一个或多个处理器;
一个或多个麦克风,用于采集音频信号;
存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1‑5中任一项所述的方法。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1‑5中任一项所述的方法。