欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2023104145884
申请人: 江西师范大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2023-12-11
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种复杂场景小目标的数据处理检测方法,其特征在于,包括以下步骤:S31:结合特征金字塔网络和路径聚合网络的思想,在YOLOv5网络结构中CSP2_1结构层的80×80预测特征层的基础上,加入与原网络相同的1×1卷积层和上采样层,将原YOLOv5的Neck网络的特征层再进行一次上采样,将其分辨率由80×80扩大到160×160,以获取小目标更为浅层的初始信息;

S32:将扩展后的高分辨率特征图与主干网络浅层特征进行特征融合,得到具备若干语义信息和位置信息的特征层;

S33:将融合后的特征层输入到卷积层中进行下采样,其中卷积核为3,步距为2,最后将其与原本卷积层输出结果进行融合。

2.根据权利要求1所述的一种复杂场景小目标的数据处理检测方法,其特征在于,其中步骤S32中主干网络上的浅层特征的特征图尺寸大小为160×160,保证步骤S32进行特征融合时,高分辨率特征图与主干网络浅层特征的特征图分辨率一致。

3.一种数据训练方法,其特征在于,包括以下步骤:

S41:数据准备,需准备复杂场景下小目标图像数据集,其中存在大量小目标,小目标种类有:人、自行车、轿车、面包车、卡车、三轮车、公共汽车和摩托车,训练及使用前根据卷积网络的要求,将图片统一大小,以保证后续计算顺利进行;

S42:数据增强,在进行训练之前对图像进行数据翻转和mosaic处理;

S43:采用权利要求1‑2任一项所述的一种复杂场景小目标的数据处理检测方法与YOLOv5相结合,并结合注意力机制,建立最终检测网络,训练模型,模型训练在进行梯度下降的过程中,初始学习率设置为0.01,并通过"one‑cycle policy"学习率调整策略和"AutoSelect"学习率自适应选择策略来动态改变和选择学习率,降低损失,以提高准确率;

S44:使用二元交叉熵损失函数用于对象损失,计算公式为:

,其中 表示所有格子即

像素点的个数,其中 表示预测的第i个格子中第j 个边界框是否包含目标,B表示每个格子预测的边界框数量, 是一个指示函数,当格子i中第j个边界框包含目标时为 1,否则为 0, 则表示当格子i中第j个边界框不包含目标时为 1,否则为 0;

使用二元交叉熵损失函数用于类别损失,计算公式为:

,其中 表示预测的第i个格子中第j个边

界框属于第c个类别的概率, 是一个指示函数,当边界框属于第c个类别时为 1,否则为 

0;

使用均方误差损失用于边界框坐标损失,计算公式为:

,其中 、

分别表示第i个格子中第j个边界框的预测中心的横坐标、预测中心的纵坐标、宽度和高度,、 、 、 分别表示第i个格子中第j个边界框的真实中心的横坐标、真实中心的纵坐标、宽度和高度,t用于表示具体位置的x、y、w、h四个参数,用于计算指定位置各参数的均方差, 是一个超参数,用于平衡边界框坐标损失和其他损失的权重;

使用GIOU损失函数计算预测框与真实框之间的重叠程度,计算公式为:、 ,

其中 是一个包含预测框和真实框的最小闭合区域的面积, 表示第i个格子中第j个边界框的真实坐标, 表示预测的坐标, 表示预测坐标与真实坐标的交集与并集的比值,用于预测的边界框与真实边界框之间的 , 是广义交并比;

S45:YOLOv5网络在后处理阶段使用非极大值抑制来处理网络输出的边界框;

S46:模型训练,训练每一个Epoch都包括了前向传播和后向传播,并且不断迭代,在迭代后期,学习率降低频率增快,损失逐渐降低,准确率、mAP、mAP 50缓慢增加。