欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2019111850322
申请人: 添津人工智能通用应用系统(天津)有限公司
专利类型:发明专利
专利状态:已下证
专利领域: 乐器;声学
更新日期:2024-02-23
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.低信噪比见长的麦克风阵列语音去噪增强方法,其特征在于:基于改进的人耳完美二元时频掩蔽算法,在语音增强预处理中抑制语音采集阶段的各类噪声干扰,主要包括以下三个步骤:第一步,初阶语音采集增强阶段;

第二步,信号噪声预估阶段;

第三步,人耳完美二元掩蔽阶段;

首先结合利用自适应旁瓣相消法和后置滤波波束形成法获得初阶采集增强的语音信号,然后根据输入的带噪信号和初阶采集增强的语音信号,判断预估噪声信号,最后通过初阶采集增强的语音信号和判断预估噪声信号之间的信噪比关系设置阈值,利用人耳的听觉掩蔽特性计算完美二元时频掩蔽算法并合成增强后的语音信号;

第三步,人耳完美二元时频掩蔽阶段采用人耳完美二元时频掩蔽语音增强法,保留带噪信号中以语音信号主导的声音部分,滤除由噪声信号主导的声音部分,实现干净语音信号和噪声信号的分离;

人耳完美二元时频掩蔽阶段具体的步骤如下:

第1步,对带噪信号中的由初阶语音采集增强的语音进行时频分解;

第2步,计算初阶语音采集增强的语音信号的时频单元功率谱;

第3步,结合信号噪声预估阶段中得到的噪声信号功率谱估计完美二元时频掩蔽结果D,具体公式为:其中,c是频带索引,t是时间索引,Es(c,t)表示初阶语音采集增强的语音信号功率,En(c,t)表示判断预估噪声的功率,J表示预设的阈值,根据初步估计的语音和噪声信号之间的信噪比关系来进行调整,如果时频单元内由初阶语音采集增强的语音功率大于判断预估噪声的功率,则该时频单元被设为1,否则设为0,利用人耳的听觉掩蔽特性计算完美二元时频掩蔽算法并合成增强后的语音信号。

2.根据权利要求1所述的低信噪比见长的麦克风阵列语音去噪增强方法,其特征在于:第一步,初阶语音采集增强阶段的输入为麦克风阵列采集的带噪语音信号,输出为经过结合自适应旁瓣相消法和后置滤波波束形成法初阶增强后的语音信号。

3.根据权利要求1所述的低信噪比见长的麦克风阵列语音去噪增强方法,其特征在于:自适应旁瓣相消法根据语音信号所处的实际应用环境自适应改变滤波系数,自适应旁瓣相消法主要有三部分组成:第一部分为固定波束形成器,固定波束形成器生成语音参考信号;

第二部分为阻塞矩阵,阻塞矩阵生成噪声参考信号;

第三部分为自适应噪声消除器,自适应噪声消除器消除来自固定波束形成器生成的信号中的残留噪声信号。

4.根据权利要求1所述的低信噪比见长的麦克风阵列语音去噪增强方法,其特征在于,自适应旁瓣相消法的具体步骤为:通过固定波束形成器后生成的信号为:T

其中经过时延补偿输出的信号用x(n)=[x1(n),…,xM(n)]表示,M为阵列中麦克风的个数,延时求和的加权系数用uc表示,所有加权系数的值都不为零,同时满足所有加权系数的和为1;

用带约束的非递归型滤波器对固定波束形成器生成的信号yc(n)进行滤波处理,得到滤波处理信号y′c(n),通过时延补偿处理,阵列中每个麦克风在注视方向所收集的带噪语音信号的相位完全相同,将阻塞矩阵中每一行元素的和设置为零,用一个零陷的滤波器把带噪信号中的语音信号滤除;

下式为阻塞矩阵的处理过程和输出的信号,

s′(n)=Ax(n)

T

其中阻塞矩阵每一行的元素am需满足两个条件,

第一个条件为和为零的条件,如下式所示,

第二个条件为am必须线性独立;

由于输出信号s′(n)最多只能由M‑1行线性独立的元素构建,阻塞矩阵的维数是一个等(M‑1)×M于或小于M‑1的数,下式表述了一种构造阻塞矩阵A∈R 的形式,自适应旁瓣相消法下半部分的输出信号yb(n),可表示为对阻塞矩阵输出信号s′(n)经过自适应滤波处理后的信号,阻塞矩阵的维数为(M‑1)×M, 表示自适应滤波器,yb(n)由下式表示,自适应噪声消除器采用最小均方算法,最小均方算法使输出信号与期望信号之间的误差的均方值最小,将自适应旁瓣相消法的上半部分通道yc(n)和下半部分通道输出yb(n)的值相结合即可得到最终的输出信号y(n),如下式所示,y(n)=y′c(n)‑yb(n)。

5.根据权利要求1所述的低信噪比见长的麦克风阵列语音去噪增强方法,其特征在于:第二步,信号噪声预估阶段利用带噪语音信号和输出的初阶采集增强的语音信号,估计出噪声信号的信号,噪声估计算法采用谱减法。

6.根据权利要求1所述的低信噪比见长的麦克风阵列语音去噪增强方法,其特征在于:人耳完美二元时频掩蔽语音增强法基于人耳的掩蔽效应提出,从带噪语音信号中构建一个时频掩蔽,并将时频掩蔽应用到带噪语音信号上,得到掩蔽掉噪声的干净语音信号,主要分为语音时频分解和语音合成增强两个部分。

7.根据权利要求6所述的低信噪比见长的麦克风阵列语音去噪增强方法,其特征在于,语音时频分解的过程为:将带噪语音通过Gammatone滤波器组,得到分帧处理后模拟耳蜗滤波后的信号,此时的信号看作被分解为不同的时频单元;然后对提取每个时频单元里的声学特征,基于能量的人耳完美二元时频掩蔽提取的特征是信号的能量。

8.根据权利要求6所述的低信噪比见长的麦克风阵列语音去噪增强方法,其特征在于,语音合成增强的过程为:估计完美二元时频掩蔽结果,如果它的信噪比大于之前设定的阈值,则被认为是由语音占主要地位的时频单元,保留这类单元;反之则被认为是由噪声占主要地位的时频单元,过滤掉这类单元;最后将经过处理后的时频单元再重新组合为增强后的语音。