欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2024100863334
申请人: 广东工业大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2025-03-30
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于MSG-YOLOv7的轻量化遥感图像军事坦克目标检测算法,其特征在于,包括具体步骤如下:S1:获取Google Earth公开的遥感军事坦克数据集,按6:2:2比例划分为训练集、验证集和测试集;

S2:在YOLOv7网络中,使用轻量级MobileNetv3替代原有Backbone,减少模型体积大小;

S3:设计更加适用于遥感目标的SD-MP模块,减少下采样过程中坦克目标的特征损失;

S4:基于GCNet和深度可分离卷积设计GD-ELAN模块,在轻量化的同时增强了模型的表示能力;

S5:将数据集输入网络进行迭代训练,训练完成后,使用最优模型对测试集进行检测得到最后结果;

在所述SD-MP模块中,S表示分离拼接,D表示DBS模块,包括深度可分离卷积、批量归一化和SILU激活函数的组合,用于进一步处理和丰富重组后的特征信息,且在SD-MP模块中,输入图像通过两条分支A分别进行特征提取,之后,则会对两条分支A处理后的特征再在通道维度上进行拼接,最终输出合并后的特征图,至此,以有效缓解了下采样过程中出现的特征丢失问题,使得模块能够捕获更丰富的细节信息;其中,两条分支A具体如下:第一条分支A采用一种分离拼接方法,首先将输入特征图分割为4个更小的子图块,并沿通道维度重新组合,以形成更加丰富的特征表达,随后,重新组合的特征通过一个卷积进一步整合,再把重组后的特征图依次经过一个DBS模块,进行特征提取;

第二条分支A将输入的特征图使用两个连续的DBS进行特征处理,以逐层提取细粒度的局部特征;

在所述GD-ELAN模块中,G表示GCNet,D表示深度可分离卷积,DBS_GC表示深度可分离卷积、批量归一化、SILU激活函数和GCNet的组合,且在GD-ELAN模块结构中,其输入特征会经过两条分支B,之后,则会对得到的所有特征图进行拼接,形成一个包含局部与全局信息的综合特征图,随后通过DBS模块进一步处理得到最终的特征图;其中,两条分支B具体如下:第一条分支B通过一个DBS_GC模块对输入特征图进行处理,先利用DBS模块提取细粒度的局部特征,再通过GCNet模块捕获图像中的全局上下文信息,实现特征信息的全面整合;

第二条分支B依次采用两个DBS模块提取丰富的局部特征,随后在DBS_GC模块中进一步处理,以实现局部与全局特征的深度融合,提取过程中每一步的特征均被传递至拼接模块,确保多尺度特征能够全面表示目标细节。

2.根据权利要求1所述的一种基于MSG-YOLOv7的轻量化遥感图像军事坦克目标检测算法,其特征在于,所述S1中遥感图像军事坦克数据集其具体为:获取来源于开源的GoogleEarth数据,其中包含了不同高度、方位、时间的4000张图片,划分出训练集2400张、验证集800张和测试集800张进行实验。

3.根据权利要求1所述的一种基于MSG-YOLOv7的轻量化遥感图像军事坦克目标检测算法,其特征在于,所述S2中使用轻量级MobileNetv3其具体为:使用MobileNetv3作为MSG-YOLOv7的骨干网络,显著减少了模型的参数量和计算量,其中,MobileNetv3是一种专为图像处理任务设计的轻量级神经网络结构,它由Bneck结构组成,这个结构由扩张卷积、深度可分离卷积、SE模块和残差连接组成,在这个结构中,扩张卷积有助于增加感受野,深度可分离卷积则降低了计算成本并促进了信息流动,而SE模块则能够更好地建模特征之间的关系,而残差连接则可以融合不同特征层之间的信息,这些模块的整合能够有效提升特征学习和信息传递的效率,有助于保持模型轻量化的同时提供良好的性能表现,使得模型更适用于资源受限的场景。

4.根据权利要求3所述的一种基于MSG-YOLOv7的轻量化遥感图像军事坦克目标检测算法,其特征在于,所述深度可分离卷积是一种卷积神经网络中常用的操作,它的设计旨在减少参数数量和计算量,同时保持模型性能,其分为两个步骤:步骤一:深度卷积,对每个输入通道进行单独的卷积操作以捕捉局部特征;

步骤二:逐点卷积,使用1×1的卷积核进行线性组合,将深度卷积的输出映射到最终的输出通道;

其中,标准卷积参数量P和计算量F公式如下:

P=DK×DK×M×N

F=DK×DK×M×N×DW×DH

其中DK代表卷积核,M代表输入通道数,N代表输出通道数,DW代表输出特征宽,DH代表输出特征高;

深度可分离卷积的参数量DP和计算量DF公式如下:

DP=DK×DK×M+M×N

DF=DK×DK×M×DW×DH+M×N×DW×DH

两者参数量和计算量对比如下:

5.根据权利要求1所述的一种基于MSG-YOLOv7的轻量化遥感图像军事坦克目标检测算法,其特征在于,所述GCNet是一种全局上下文模块,能够在图像处理中获取全局信息,这种全局信息对于正确区分目标和背景,以及理解目标与周围环境的关系非常重要,对于提高坦克目标检测的准确性和可靠性非常有效,其计算过程如下:Y=X×σ(Wv2Relu(LN(Wv1Y1)))

公式中,Xi表示特征图中的任意位置信息,Np表示所有位置数量,Wk表示权重参数,Softmax表示归一化操作,Y1为得到的特征矩阵,Relu为激活函数,LN为层归一化,Wv1、Wv2分别为两个卷积层v1、v2的权重参数,σ为sigmoid函数,Y为最终特征图。

6.根据权利要求1所述的一种基于MSG-YOLOv7的轻量化遥感图像军事坦克目标检测算法,其特征在于,所述S5中模型训练其具体为:实验在Ubuntu 16.04环境下进行,采用Python 3.8和PyTorch 1.9.0作为开发工具,在硬件配置方面,使用了GeForce RTX3090GPU和Core i9-10900 CPU,配备了CUDA 11.1,系统内存容量为64GB,模型训练中设置了图片大小为640×640,并使用了SGD优化器,批量大小为16,训练迭代次数为200次。

7.根据权利要求1所述的一种基于MSG-YOLOv7的轻量化遥感图像军事坦克目标检测算法,其特征在于,所述S5中获取模型检测结果其具体为:将改进后算法与不同算法进行对比,选取权重大小、每秒传输帧数、参数量、计算量和平均精度AP指标来评估模型性能,其AP计算公式如下:公式中,P为精度、R为召回率,TP为正确检测的数量,FP为被错检为正样本的数量,FN为被错检为负样本的数量。

8.根据权利要求7所述的一种基于MSG-YOLOv7的轻量化遥感图像军事坦克目标检测算法,其特征在于,所述S5中将改进后算法与不同算法进行对比其具体为:为了准确地验证MSG-YOLOv7算法在遥感坦克检测任务中的性能,将其与SSD、YOLOv3、YOLOv4、YOLOv5、YOLOv7、YOLO-FSD和DCN-YOLO算法进行比较,在同等条件下训练和测试以上各算法。