1.一种融合改进注意力机制的目标检测算法,其特征在于,包括以下步骤:S1:采集原始图片制作数据集;
S2:构建网络模型:
S3:搭建实验环境,利用S1中的数据集对S2中构建的网络模型进行训练和验证,获取训练好的模型权重;
S4:利用S3得到的模型权重对算法进行评估,以及在真实场景图片上进行测试。
2.根据权利要求1所述的一种融合改进注意力机制的目标检测算法,其特征在于,所述S1中采集的图片涵盖了多种物体类别,并对图片的类别和位置信息进行标注。
3.根据权利要求1所述的一种融合改进注意力机制的目标检测算法,其特征在于,所述S2中构建网络模型是基于YOLOv4目标检测算法,在其主干特征提取网络CSPDarknrt的三个输出部分以及特征融合PANet的三个横向连接部分嵌入改进CA注意力机制,所述改进CA注意力机制称为DCA注意力机制。
4.根据权利要求2所述的一种融合改进注意力机制的目标检测算法,其特征在于,所述DCA注意力机制对输入特征的处理如下:S21:首先对输入使用两个不同大小空洞率的空洞卷积并联以扩大模型的感受野;其中小空洞率捕获近距离信息,大空洞率关心远距离信息,设输入为x,经下式的空洞卷积处理后输出为dx:
dx=[dconv2(x),dconv5(x)]式中dconv2表示空洞率为2的小空洞卷积,dconv5表示空洞率为5的大空洞卷积,[,]表示沿维度的拼接;
S22:利用尺寸为(H,1)和(1,W)的两个全局平均池化核对空洞卷积后的特征分别沿水平方向和垂直方向进行编码得到 和其中, 和 分别表示第c个通道的水平方向和垂直方向的特征编码,dxc(h,i)表示c通道中高度为h的第i个竖直张量,dxc(j,w)表示c通道中宽度为w的第j个水平张量,H、W为(H,1)和(1,W)池化核相应维度的数值;
S23:使用两个一维卷积、批尺寸归一化和激活操作分别对特征编码进行变换并将两个方向的特征映射进行合并,得到下式中的特征p:h w
p=Leakyrelu(BN(conv(z)))×Leakyrelu(BN(conv(z)))h
其中conv()为一维卷积操作,BN()为批尺寸归一化操作,Leakyrelu()为激活函数,zw
和z分别表示水平方向和垂直方向的全通道特征编码;
S24:最后直接利用一个全局的卷积操作调整通道,通过简单但有效的加法对全文特征进行融合,得到了下式中聚合了多尺度上下文信息的输出yc(i,j):yc(i,j)=xc(i,j)+conv(pc(i,j))其中xc(i,j)为第c个通道的原始输入特征,conv(pc(i,j))为调整通道后的变换特征,(i,j)表示像素点坐标。
5.根据权利要求1所述的一种融合改进注意力机制的目标检测算法,其特征在于,所述S3中,在训练过程中采用欧氏距离和平均绝对误差的联合损失L指导网络训练,L的定义如下:
式中LMSE为平均绝对误差损失,Fk为第k个标签图,Fk(xk,θ)为预测图,θ为学习参数,N为图片数量。
6.根据权利要求1所述的一种融合改进注意力机制的目标检测算法,其特征在于,所述S4中,采用精确率、召回率和平均准确度均值三项指标对模型性能进行评估。
7.根据权利要求6所述的一种融合改进注意力机制的目标检测算法,其特征在于,所述精确率表示预测为正样本的数据中真实正样本所占的比例,即“查准率”,由下式表示:Precision表示精确率,TP表示正样本被正确预测为正样本的数量,FP表示负样本被错误预测为正样本的数量。
8.根据权利要求7所述的一种融合改进注意力机制的目标检测算法,其特征在于,所述召回率表示在总的正样本中模型预测出的正样本所占的比例,即“查全率”,由下式表示:Recall表示召回率、FN表示正样本被错误预测为负样本的数量。
9.根据权利要求8所述的一种融合改进注意力机制的目标检测算法,其特征在于,平均准确率AP对不同召回率点上的精确率进行平均,表示单个目标类别的综合平均精度,由下式表示:
1
AP=∫0Precision(Recall)dRecalld的物理含义
平均准确度均值由下式表示:
mAP是多个类别AP的平均值;APa为第a个类别的平均准确率,n为类别总数。