1.一种利用特征图融合的目标检测方法,其特征在于,包括如下步骤:步骤S1:利用ZF网络提取图像特征并得到特征图;
所述步骤S1包括以下步骤:
步骤S101:对输入图像进行归一化处理,使图像的大小均为224×224像素;
步骤S102:利用ZF网络提取归一化后的图像特征并得到一系列处于不同层次的特征图;
步骤S2:对所得特征图进行特征图融合并得到新特征图;
所述步骤S2包括以下步骤:
步骤S201:根据特征图融合思想选取ZF网络提取的第3层和第4层浅层特征图Conv3和Conv4;
步骤S202:利用1×1的卷积核对浅层特征图Conv3和Conv4进行降维,且降维到特征图Conv5的大小;
步骤S203:将降维后的特征图Conv3和Conv4与特征图Conv5中进行融合得到新特征图;
所述步骤S202中对浅层特征图Conv3和Conv4进行降维的计算公式如下:GConvi(m,n,d)=f(gConvi(m,n,k)*δConvi(1,1,k)+b)其中,参数m、n分别表示特征图的长和宽,k和d和分别表示浅层特征图降维前的通道数和浅层特征图降维后的通道数,gConvi(m,n,k)表示浅层特征图Convi且i的取值为3或4,GConvi(m,n,d)表示gConvi(m,n,k)降维后的特征图,δConvi(1,1,k)表示得到的GConvi(m,n,d)时所需的1×1的卷积核,b表示得到GConvi(m,n,d)时所需的标量参数,*表示卷积,f()表示激活函数;
所述步骤S203中将降维后的特征图Conv3和Conv4与特征图Conv5中进行融合的计算公式如下:Fnew(m,n,d)=∑λiGConvi(m,n,d)+γgConv5(m,n,d)其中,常量参数λi和γ分别表示特征图融合时浅层特征图和最深层特征图的权值,Fnew(m,n,d)表示新特征图,gConv5(m,n,d)表示特征图Conv5;
步骤S3:通过RPN网络获取区域建议;
步骤S4:把新特征图和区域建议输入到后续网络层中得到目标检测结果。
2.根据权利要求1所述的目标检测方法,其特征在于,所述步骤S201包括以下步骤:步骤S2011:根据卷积神经网络提取的不同层次的特征图具有的不同特点,总结出将浅层特征图降维后和最深层特征图进行融合得到新特征图;
步骤S2012:根据特征图融合及ZF网络的结构、卷积层数及各层次特征图需要降维的具体情况,确定选取ZF网络中第3层和第4层卷积层产生的特征图Conv3和Conv4。
3.根据权利要求1所述的目标检测方法,其特征在于,所述步骤S3包括以下步骤:步骤S301:将新特征图输入到RPN网络中得到候选窗口,其过程如下:利用3×3的卷积核在输入的新特征图上滑动,并在3×3的卷积核滑过的每个位置处都生成12种候选窗口,其中包括3种长宽比例{1:1,1:2,2:1}和4种面积种类{64×64,128×128,256×256,512×
512},卷积核滑过新特征图的所有位置后得到所有的候选窗口;
步骤S302:利用Softmax层从中选取包含目标的候选窗口,其过程如下:Softmax层是一种具有多分类功能的卷积神经网络层,将候选窗口分成包含目标的候选窗口和不包含目标的候选窗口,且Softmax层为每一个包含目标的候选窗口生成一个分数,根据该分数选取候选窗口;
步骤S303:通过非极大值抑制对包含目标的候选窗口进行再次筛选,并将筛选出的候选窗口作为RPN网络的输出,得到区域建议。
4.根据权利要求1所述的目标检测方法,其特征在于,所述步骤S4包括以下步骤:步骤S401:将新特征图和区域建议输入到ROIPooling层中得到区域建议的特征;
步骤S402:用Softmax层对区域建议的特征进行分类得到目标的类别,同时进行边框回归得到更加准确的目标边界框,得到图像的目标检测结果。
5.根据权利要求4所述的目标检测方法,其特征在于,步骤S401具体包括如下步骤:步骤S4011:把区域建议按照由归一化的图像到最深层特征图Conv5的尺度变化进行相同的变化映射;
步骤S4012:将映射后的区域建议在水平和竖直都分为7份;
步骤S4013:对每一份都进行max pooling最大值下采样处理,得到区域建议的特征且特征的大小均为7×7像素。