1.一种基于深度神经网络的声源定位方法,其特征在于,包括深度神经网络的训练阶段和深度神经网络的测试阶段,包括步骤:S1.获取麦克风接收的语音信号,并将获取到的语音信号生成语音数据集;其中,所述语音数据集包括训练数据集和测试数据集;
S2.对所述生成的语音数据集内的语音信号进行第一预处理;
S3.计算所述预处理后的语音信号所对应的声源信号的相位加权广义互相关函数;
S4.获取与所述相位加权广义互相关函数波峰相对应的时延信息,并将所述获取的时延信息作为声源信号到达麦克风的TDOA观测值;并获取所述时延信息对应的幅值;
S5.将所述TDOA观测值与幅值结合作为深度神经网络的输入向量,将声源信号对应的三维空间位置坐标作为神经网络的输出向量,将所述输入向量和输出向量结合生成特征向量;
S6.对所述生成的特征向量进行第二预处理;
S7.在深度神经网络的训练阶段,设置深度神经网络相关的参数,并用训练集的特征向量训练深度神经网络,得到训练好的深度神经网络;
S8.在深度神经网络的测试阶段,将测试集的输入向量传入训练好的深度神经网络进行预测,得到声源信号的三维空间位置坐标,并采用交叉验证评估深度神经网络模型的性能;
所述步骤S5具体为:
将时延信息 及其所对应的幅值 结合作为深度神经网络的输入向量I:将声源信号S对应的三维空间位置坐标Q作为神经网络的输出向量:将所述输入向量I和输出向量Q结合生成特征向量G:T
G=(I,Q) 。
2.根据权利要求1所述的一种基于深度神经网络的声源定位方法,其特征在于,所述步骤S1中麦克风阵列的集合为V={1,2,…,M};每个麦克风节点m包含两个麦克风,其中m∈V;
M表示共有M个麦克风节点。
3.根据权利要求2所述的一种基于深度神经网络的声源定位方法,其特征在于,所述步骤S2具体为对麦克风节点m内的两个麦克风接收的语音信号进行第一预处理,所述第一预处理包括分帧、加窗、预加重。
4.根据权利要求2所述的一种基于深度神经网络的声源定位方法,其特征在于,所述步骤S3具体为计算预处理后的麦克风节点m内的两个麦克风语音信号的相位加权广义互相关函数Rm(τ),表示为:
其中,m∈V, 和 分别表示为在节点m处的时域麦克风信号 和的所对应的频域部分;符号*表示为复共轭操作。
5.根据权利要求4所述的一种基于深度神经网络的声源定位方法,其特征在于,所述步骤S4获取与所述相位加权广义互相关函数Rm(τ)波峰相对应的时延信息 表示为:并获取所述时延信息 对应的幅值
6.根据权利要求5所述的一种基于深度神经网络的声源定位方法,其特征在于,所述步骤S6中的第二预处理包括数据清洗、数据乱序、数据归一化。
7.根据权利要求6所述的一种基于深度神经网络的声源定位方法,其特征在于,所述步骤S8中采用的交叉验证包括留一验证法。
8.一种基于深度神经网络的声源定位系统,其特征在于,包括:第一获取模块,用于获取麦克风接收的语音信号,并将获取到的语音信号生成语音数据集;其中,所述语音数据集包括训练数据集和测试数据集;
第一预处理模块,用于对所述生成的语音数据集内的语音信号进行第一预处理;
计算模块,用于计算所述预处理后的语音信号所对应的声源信号的相位加权广义互相关函数;
第二获取模块,用于获取与所述相位加权广义互相关函数波峰相对应的时延信息,并将所述获取的时延信息作为声源信号到达麦克风的TDOA观测值;并获取所述时延信息对应的幅值;
生成模块,用于将所述TDOA观测值与幅值结合作为深度神经网络的输入向量,将声源信号对应的三维空间位置坐标作为神经网络的输出向量,将所述输入向量和输出向量结合生成特征向量;
第二预处理模块,用于对所述生成的特征向量进行第二预处理;
训练模块,用于设置深度神经网络相关的参数,并用训练集的特征向量训练深度神经网络,得到训练好的深度神经网络;
生成模块中具体包括:
将时延信息 及其所对应的幅值 结合作为深度神经网络的输入向量I:将声源信号S对应的三维空间位置坐标Q作为神经网络的输出向量:将所述输入向量I和输出向量Q结合生成特征向量G:T
G=(I,Q) 。
9.根据权利要求8所述的一种基于深度神经网络的声源定位系统,其特征在于,还包括:
测试模块,用于将测试集的输入向量传入训练好的深度神经网络进行预测,得到声源信号的三维空间位置坐标,并采用交叉验证评估深度神经网络模型的性能。