1.一种基于浅层空间特征融合与自适应通道筛选的目标检测方法,其特征在于,包括以下步骤:
1)、获取用于目标检测的数据集,选取并划分目标检测任务所需的训练集和验证集;
2)、对训练集图像进行数据增强,分别对训练集图像和验证集图像中的样本图像进行数据增强;其中数据增强包括光度畸变和几何畸变;
3)、将步骤2)处理后的数据输入基于Pytorch开源深度学习框架设计的卷积神经网络中,所述卷积神经网络包括浅层空间特征融合模块和自适应通道筛选模块,浅层空间特征融合模块用于下采样过程中的多尺度特征融合,自适应通道筛选模块用于对融合后的特征图进行通道权重再分配,输出图像中可能存在目标的位置与类别信息;
4)、计算网络模型的输出信息与对应标注信息的损失,采用位置分类损失函数联合训练并优化检测模型;
5)、利用优化后的模型参数,检测真实场景图像中是否存在目标,得到相应的目标检测框;
所述步骤3)卷积神经网络包括:
基础网络模块,采用VGG‑16网络,并将VGG‑16的全连接层fc6和fc7转换成3×3的卷积层Conv6和1×1卷积层Conv7,同时在后面增加了8个卷积层;用于生成不同尺度的特征图;
浅层空间特征融合模块,根据不同的应用场景,该模块具体分为3类,第一类适用于8倍下采样特征融合,第二类适用于4倍下采样特征融合,第三类适用于2倍下采样特征融合;
自适应通道筛选模块,首先通过全局平均池化操作获取每个特征通道的信息量大小,再通过两个全连接层以及激活层获取特征通道注意力向量,通过学习的方式自适应地为每个通道分配不同的权重;
目标检测框生成模块,用于生成目标位置、类别及其置信度信息;
所述第一类适用于8倍下采样特征融合,包含两组深度可分离卷积模块、两个抗锯齿卷积层与一次平均池化下采样操作,第一组深度可分离卷积中的深度卷积层的卷积核大小为
3×3,膨胀率为5,第二组对应的膨胀率为3,平均池化执行两倍下采样操作;抗锯齿卷积层用于降低下采样过程中引入的混叠效应;
第二类适用于4倍下采样特征融合,包含一组深度可分离卷积模块、一个抗锯齿卷积层与一次池化下采样操作;第三类适用于2倍下采样特征融合,包含一组深度可分离卷积与抗锯齿卷积层。
2.根据权利要求1所述的基于浅层空间特征融合与自适应通道筛选的目标检测方法,其特征在于,所述步骤1)训练集图像和验证集图像,在将PascalVOC2007与2012数据集进行合并后,按照9:1的比例划分为训练集图像与验证集图像。
3.根据权利要求1所述的基于浅层空间特征融合与自适应通道筛选的目标检测方法,其特征在于,所述步骤2)的光度畸变包括随机亮度、随机对比度、随机色调和随机饱和度,几何畸变包括随机扩展、随机裁剪、随机翻转。
4.根据权利要求1所述的基于浅层空间特征融合与自适应通道筛选的目标检测方法,其特征在于,所述自适应通道筛选模块中,特征通道注意力向量W=σ(W2(δ(W1))),C表示通C×C/r道数,此处取值为1664,σ表示sigmoid激活函数,δ表示ReLU激活函数,W1和W2∈R 分别表示两个全连接层参数,r表示维度收缩比例。
5.根据权利要求 1所述的基于浅层空间特征融合与自适应通道筛选的目标检测方法,其特征在于,所述步骤4)优化卷积神经网络参数采用的位置损失函数为Smooth L1损失函数,分类损失函数为多分类交叉熵损失函数与基于余弦距离的损失函数之和;
位置损失函数为Smooth L1函数,公式如下:
Lloc(x)表示定位损失函数,x表示位置信息预测向量与位置标签向量的差;
分类损失函数公式如下:
L=Lce+Lcos
Lce表示多分类交叉熵损失函数,Lcos表示基于余弦距离的分类损失函数,L表示总的分类损失函数;
*
设p为实际的标签分布,p为模型预测的标签分布,N表示当前的类别总数,则有:设xi,yi分别表示模型预测的分类结果向量与数据集对应标签经过one‑hot编码后得到的向量,ε=1e‑5,则有:其中:
该损失函数利用余弦距离的性质“当两个向量方向相同时其余弦相似度为1,正交时为
0,相反时为‑1”,使得目标分类的结果更加准确。