1.一种基于MSG-YOLOv7的轻量化遥感图像军事坦克目标检测算法,其特征在于,包括具体步骤如下:S1:获取Google Earth公开的遥感军事坦克数据集,按6:2:2比例划分为训练集、验证集和测试集;
S2:在YOLOv7网络中,使用轻量级MobileNetv3替代原有Backbone,减少模型体积大小;
S3:设计更加适用于遥感目标的SD-MP模块,减少下采样过程中坦克目标的特征损失;
S4:基于GCNet和深度可分离卷积设计GD-ELAN模块,在轻量化的同时增强了模型的表示能力;
S5:将数据集输入网络进行迭代训练,训练完成后,使用最优模型对测试集进行检测得到最后结果;
在所述SD-MP模块中,S表示分离拼接,D表示DBS模块,包括深度可分离卷积、批量归一化和SILU激活函数的组合,用于进一步处理和丰富重组后的特征信息,且在SD-MP模块中,输入图像通过两条分支A分别进行特征提取,之后,则会对两条分支A处理后的特征再在通道维度上进行拼接,最终输出合并后的特征图,至此,以有效缓解了下采样过程中出现的特征丢失问题,使得模块能够捕获更丰富的细节信息;其中,两条分支A具体如下:第一条分支A采用一种分离拼接方法,首先将输入特征图分割为4个更小的子图块,并沿通道维度重新组合,以形成更加丰富的特征表达,随后,重新组合的特征通过一个卷积进一步整合,再把重组后的特征图依次经过一个DBS模块,进行特征提取;
第二条分支A将输入的特征图使用两个连续的DBS进行特征处理,以逐层提取细粒度的局部特征;
在所述GD-ELAN模块中,G表示GCNet,D表示深度可分离卷积,DBS_GC表示深度可分离卷积、批量归一化、SILU激活函数和GCNet的组合,且在GD-ELAN模块结构中,其输入特征会经过两条分支B,之后,则会对得到的所有特征图进行拼接,形成一个包含局部与全局信息的综合特征图,随后通过DBS模块进一步处理得到最终的特征图;其中,两条分支B具体如下:第一条分支B通过一个DBS_GC模块对输入特征图进行处理,先利用DBS模块提取细粒度的局部特征,再通过GCNet模块捕获图像中的全局上下文信息,实现特征信息的全面整合;
第二条分支B依次采用两个DBS模块提取丰富的局部特征,随后在DBS_GC模块中进一步处理,以实现局部与全局特征的深度融合,提取过程中每一步的特征均被传递至拼接模块,确保多尺度特征能够全面表示目标细节。
2.根据权利要求1所述的一种基于MSG-YOLOv7的轻量化遥感图像军事坦克目标检测算法,其特征在于,所述S1中遥感图像军事坦克数据集其具体为:获取来源于开源的GoogleEarth数据,其中包含了不同高度、方位、时间的4000张图片,划分出训练集2400张、验证集800张和测试集800张进行实验。
3.根据权利要求1所述的一种基于MSG-YOLOv7的轻量化遥感图像军事坦克目标检测算法,其特征在于,所述S2中使用轻量级MobileNetv3其具体为:使用MobileNetv3作为MSG-YOLOv7的骨干网络,显著减少了模型的参数量和计算量,其中,MobileNetv3是一种专为图像处理任务设计的轻量级神经网络结构,它由Bneck结构组成,这个结构由扩张卷积、深度可分离卷积、SE模块和残差连接组成,在这个结构中,扩张卷积有助于增加感受野,深度可分离卷积则降低了计算成本并促进了信息流动,而SE模块则能够更好地建模特征之间的关系,而残差连接则可以融合不同特征层之间的信息,这些模块的整合能够有效提升特征学习和信息传递的效率,有助于保持模型轻量化的同时提供良好的性能表现,使得模型更适用于资源受限的场景。
4.根据权利要求3所述的一种基于MSG-YOLOv7的轻量化遥感图像军事坦克目标检测算法,其特征在于,所述深度可分离卷积是一种卷积神经网络中常用的操作,它的设计旨在减少参数数量和计算量,同时保持模型性能,其分为两个步骤:步骤一:深度卷积,对每个输入通道进行单独的卷积操作以捕捉局部特征;
步骤二:逐点卷积,使用1×1的卷积核进行线性组合,将深度卷积的输出映射到最终的输出通道;
其中,标准卷积参数量P和计算量F公式如下:
P=DK×DK×M×N
F=DK×DK×M×N×DW×DH
其中DK代表卷积核,M代表输入通道数,N代表输出通道数,DW代表输出特征宽,DH代表输出特征高;
深度可分离卷积的参数量DP和计算量DF公式如下:
DP=DK×DK×M+M×N
DF=DK×DK×M×DW×DH+M×N×DW×DH
两者参数量和计算量对比如下:
5.根据权利要求1所述的一种基于MSG-YOLOv7的轻量化遥感图像军事坦克目标检测算法,其特征在于,所述GCNet是一种全局上下文模块,能够在图像处理中获取全局信息,这种全局信息对于正确区分目标和背景,以及理解目标与周围环境的关系非常重要,对于提高坦克目标检测的准确性和可靠性非常有效,其计算过程如下:Y=X×σ(Wv2Relu(LN(Wv1Y1)))
公式中,Xi表示特征图中的任意位置信息,Np表示所有位置数量,Wk表示权重参数,Softmax表示归一化操作,Y1为得到的特征矩阵,Relu为激活函数,LN为层归一化,Wv1、Wv2分别为两个卷积层v1、v2的权重参数,σ为sigmoid函数,Y为最终特征图。
6.根据权利要求1所述的一种基于MSG-YOLOv7的轻量化遥感图像军事坦克目标检测算法,其特征在于,所述S5中模型训练其具体为:实验在Ubuntu 16.04环境下进行,采用Python 3.8和PyTorch 1.9.0作为开发工具,在硬件配置方面,使用了GeForce RTX3090GPU和Core i9-10900 CPU,配备了CUDA 11.1,系统内存容量为64GB,模型训练中设置了图片大小为640×640,并使用了SGD优化器,批量大小为16,训练迭代次数为200次。
7.根据权利要求1所述的一种基于MSG-YOLOv7的轻量化遥感图像军事坦克目标检测算法,其特征在于,所述S5中获取模型检测结果其具体为:将改进后算法与不同算法进行对比,选取权重大小、每秒传输帧数、参数量、计算量和平均精度AP指标来评估模型性能,其AP计算公式如下:公式中,P为精度、R为召回率,TP为正确检测的数量,FP为被错检为正样本的数量,FN为被错检为负样本的数量。
8.根据权利要求7所述的一种基于MSG-YOLOv7的轻量化遥感图像军事坦克目标检测算法,其特征在于,所述S5中将改进后算法与不同算法进行对比其具体为:为了准确地验证MSG-YOLOv7算法在遥感坦克检测任务中的性能,将其与SSD、YOLOv3、YOLOv4、YOLOv5、YOLOv7、YOLO-FSD和DCN-YOLO算法进行比较,在同等条件下训练和测试以上各算法。