欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2018102973121
申请人: 百度在线网络技术(北京)有限公司
专利类型:发明专利
专利状态:已下证
专利领域: 乐器;声学
更新日期:2024-02-23
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种远场语音降噪方法,其特征在于,所述方法包括:采集用户的唇部特征,并识别所述唇部特征的特征位置值;

比对所述特征位置值与标准位置值,判断唇部是否处于活动状态;

确定处于活动状态的唇部在空间上的空间位置值;

根据所述空间位置值,朝向处于活动状态的唇部的方位收取音频信号;以及对所述音频信号进行音频处理;

其中,所述标准位置值是通过统计得出的当唇部处于静止状态时唇部特征的位置值;

其中所述采集用户的唇部特征,包括:通过人像采集算法,采集用户的面部特征;以及通过色度识别算法,识别所述用户的唇部特征;

其中所述特征位置值包括特征坐标值,所述标准位置值包括标准坐标值;

所述比对所述特征位置值与标准位置值,判断唇部是否处于活动状态,包括:计算所述唇部特征的特征坐标值与标准坐标值之间的位置偏差;以及当所述位置偏差超过阈值范围时,判断唇部处于活动状态;

其中,所述标准坐标值是通过统计得出的当唇部处于静止状态时唇部特征的坐标值。

2.根据权利要求1所述的方法,其特征在于,所述根据所述空间位置值,朝向处于活动状态的唇部的方位收取音频信号,包括:根据所述空间位置值,设置波束成形算法中的指向角度值;以及通过所述波束成形算法和所述指向角度值,麦克风阵列指向性的收取音频信号。

3.根据权利要求2所述的方法,其特征在于,所述根据所述空间位置值,朝向处于活动状态的唇部的方位收取音频信号,还包括:通过回声消除算法,消除所述音频信号中的回声。

4.根据权利要求3所述的方法,其特征在于,所述对所述音频信号进行音频处理,包括:对所述音频信号进行抑制噪音处理;以及去除所述音频信号中的混响。

5.根据权利要求1-4任一项权利要求所述的方法,其特征在于,所述方法还包括:将处理后的音频信号输出至远场语音识别引擎。

6.一种远场语音降噪系统,其特征在于,所述系统包括:唇部识别单元,配置用于采集用户的唇部特征,并识别所述唇部特征的特征位置值;

活动判断单元,配置用于比对所述特征位置值与标准位置值,判断唇部是否处于活动状态;

位置确定单元,配置用于确定处于活动状态的唇部在空间上的空间位置值;

音频收取单元,配置用于根据所述空间位置值,朝向处于活动状态的唇部的方位收取音频信号;以及音频处理单元,配置用于对所述音频信号进行音频处理;

其中,所述标准位置值是通过统计得出的当唇部处于静止状态时唇部特征的位置值;

其中所述唇部识别单元包括:

人像采集单元,配置用于通过人像采集算法,采集用户的面部特征;以及色度识别单元,配置用于通过色度识别算法,识别所述用户的唇部特征;所述特征位置值包括特征坐标值,所述标准位置值包括标准坐标值;

所述活动判断单元包括:

偏差计算单元,配置用于计算所述唇部特征的特征坐标值与标准坐标值之间的位置偏差;以及状态判断单元,配置用于当所述位置偏差超过阈值范围时,判断唇部处于活动状态;

其中,所述标准坐标值是通过统计得出的当唇部处于静止状态时唇部特征的坐标值。

7.根据权利要求6所述的系统,其特征在于,所述音频收取单元包括:角度设置单元,配置用于根据所述空间位置值,设置波束成形算法中的指向角度值;以及指向收取单元,配置用于通过所述波束成形算法和所述指向角度值,麦克风阵列指向性的收取音频信号。

8.根据权利要求7所述的系统,其特征在于,所述音频收取单元还包括:回声消除单元,配置用于通过回声消除算法,消除所述音频信号中的回声。

9.根据权利要求8所述的系统,其特征在于,所述音频处理单元包括:抑制噪音单元,配置用于对所述音频信号进行抑制噪音处理;以及去除混响单元,配置用于去除所述音频信号中的混响。

10.根据权利要求6-9任一项权利要求所述的系统,其特征在于,所述系统还包括:音频输出单元,配置用于将处理后的音频信号输出至远场语音识别引擎。

11.一种远场语音降噪终端,其特征在于,所述终端包括:一个或多个处理器;

存储器,用于存储一个或多个程序;

当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1-5中任一所述的方法。

12.一种计算机可读存储介质,其存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-5中任一项所述的方法。