1.一种基于分频和改进的广义互相关双耳时延估计方法,其特征在于,包括以下步骤:S1:获取包含混响的双耳语音信号,分别用两个麦克风放到人工头的左右耳上,两个麦克风采集到的信号卷积上头部脉冲响应即为双耳语音信号;
S2:对步骤S1得到的含混响的双耳语音信号,使用Gammatone滤波器组对双耳信号进行分频处理,得到不同频率的子带双耳信号;
S3:步骤S2得到的子带语音信号变换到倒谱域,进行倒谱预滤波去混响处理,获得去混响的左右耳各子带信号;
S4:步骤S3得到的去混响的左右耳各子带信号采用改进的广义互相关时延估计方法求取双耳时间差,所述改进广义互相关时延估计方法包括:在传统广义互相关法的基础上采用改进的相位加权MPHAT;
S5:根据双耳时间差几何模型,采用步骤S4得到的双耳时间差获取目标声源的方位;
所述广义互相关方法的具体步骤为:
S51:经过上述步骤滤波处理后的双耳信号表示为x1(n)和x2(n),x1(n)表示经过上述步骤处理过后的去混左子带信号,x2(n)表示表示经过上述步骤处理过后的去混右子带信号,得到的互功率函数表示:式中, 表示滤波器H2(f)的复共轭; 表示双耳信号未经过滤波处理时的互功率谱函数, 表示经过滤波处理后的双耳信号x1(n)和x2(n)的互功率谱函数;
S52:将步骤S51中公式代入互相关函数可以得到信号x1(n)和x2(n)的广义互相关函数:其中,ψ(f)为加权函数,
S53:在实际应用中,对互相关函数进行估计,则步骤S52中公式可表示为:若加权函数ψ(f)=1,即基本的互相关算法,若ψ(f)≠1,则称为广义互相关;
改进的相位变化加权函数MPHAT表示为:
其中,ν(f)定义为:
R是阈值,其取值范围为:0≤R≤1;γ是噪声频率分量的最低值,其取值范围为:0≤γ<1;
ν'(f)为双耳接收到信号的归一化量,其表达式为:
α和β是根据环境决定的谱减法参数,N(f)为噪声功率谱。
2.根据权利要求1所述的基于分频和改进的广义互相关双耳时延估计方法,其特征在于,所述步骤S1采用双麦克风模拟人耳听觉系统获取包含混响的双耳语音信号。
3.根据权利要求2所述的基于分频和改进的广义互相关双耳时延估计方法,其特征在于,所述双麦克风模拟人耳听觉系统是根据耳蜗基底膜的分频特性,语音信号各个频率分量在基底膜相对应的位置上出现共振峰实现模拟人儿听觉系统的,耳蜗通常被认为是一组并行的带通滤波器,每个滤波器用来模拟沿着耳蜗基底膜某一特定典型点的频率响应,即沿着膜的每个位置具有特征频率,当该频率的纯音作为输入时,该位置出现峰值;对于复合音信号,则不同频率分量在基底膜映射的相应位置出现峰值,这样就把多频信号分解为了多个单频分量,因此,信号在基底膜各个位置上的响应过程相当于一次滤波;高频的信号输入引起更接近基底膜底部的最大位移,而低频信号输入会导致基底膜顶点处的最大位移,在基底膜顶端附近的频率分辨率高于在底端附近的频率分辨率,对于等效的滤波器组,意味着低频处紧密地分布着较窄的带宽,高频处分布着间隔更远的较宽的带宽。
4.根据权利要求2所述的基于分频和改进的广义互相关双耳时延估计方法,其特征在于,所述Gammatone滤波器组的脉冲响应时域表达式为:其中,θ和A分别为Gammatone滤波器的初始相位和增益,f0为滤波器中心频率,对应基底膜上的特征频率,u(t)为阶跃函数,当t<0时,u(t)=0,当t>0时,u(t)=1,b和n是定义包络的参数,用来调整伽马函数的分布,n为滤波器的阶数,并确定边沿的斜率。
5.根据权利要求4所述的基于分频和改进的广义互相关双耳时延估计方法,其特征在于,所述滤波器的阶数n=4,b定义为脉冲响应的持续时间,也就是带宽,即b=1.019ERB(f0),ERB(f0)表示中心频率为f0的Gammatone滤波器等效矩形带宽,可表示为:ERB(f0)=2.47+0.108f0
从公式中可看出,Gammatone滤波器带宽与中心频率成正比。
6.根据权利要求4所述的基于分频和改进的广义互相关双耳时延估计方法,其特征在于,所述步骤S3进行倒谱滤波去混响处理包括步骤:S41:分别在左子带信号xl(n)和右子带信号xr(n)的每一帧上加上指数窗ω(n)=αn,0≤n≤K-1,其中K是窗长,0<α≤1;
S42:对步骤S41加上指数窗后的左右子带信号分别进行倒谱处理,并计算倒谱域接收信号和脉冲信号的最小相位分量;
表示脉冲信号的最小相位分量,k表示倒谱域
变量, 表示脉冲响应,在倒谱域中, 可由一个最小相位分量和一个全通分量级联组成;
S43:通过连续信号帧递归获得估计的混响分量,即
其中,0<μ<1,m表示帧数; 表示倒谱域接收信号的最小相位分量;
S44:子带信号 减去混响部分 得到去混后的倒谱子带信号:
S45:再将 反变换到时域,并且使用逆指数窗,得到去混子带信号。