知嘟嘟-专利交易平台_专利购买_专利出售-买专利,上嘟嘟

欢迎来到知嘟嘟！联系电话：13095918853 卖家免费入驻，海量在线求购！卖家免费入驻，海量在线求购！

嘟嘟会员

帮助中心网站地图

查出售查高校查求购查年费

我要发布

首页转移热力图Hot 专利交易委托购买高校专区科技服务专利求购年费查询行业资讯

联系电话：13095918853

知嘟嘟经纪人

一种复杂场景小目标的数据训练方法

￥42400

专利号： 2023104145884

申请人：江西师范大学

专利类型：发明专利

专利状态：已下证

专利领域：计算；推算；计数

更新日期：2023-12-11

缴费截止日期：暂无

价格&联系人

年费信息

委托购买

专利简介

专利详情

委托购买说明

需准备材料

常见问题

摘要:

权利要求书:

1.一种复杂场景小目标的数据处理检测方法，其特征在于，包括以下步骤：S31：结合特征金字塔网络和路径聚合网络的思想，在YOLOv5网络结构中CSP2_1结构层的80×80预测特征层的基础上，加入与原网络相同的1×1卷积层和上采样层，将原YOLOv5的Neck网络的特征层再进行一次上采样，将其分辨率由80×80扩大到160×160，以获取小目标更为浅层的初始信息；

S32：将扩展后的高分辨率特征图与主干网络浅层特征进行特征融合，得到具备若干语义信息和位置信息的特征层；

S33：将融合后的特征层输入到卷积层中进行下采样，其中卷积核为3，步距为2，最后将其与原本卷积层输出结果进行融合。

2.根据权利要求1所述的一种复杂场景小目标的数据处理检测方法，其特征在于，其中步骤S32中主干网络上的浅层特征的特征图尺寸大小为160×160，保证步骤S32进行特征融合时，高分辨率特征图与主干网络浅层特征的特征图分辨率一致。

3.一种数据训练方法，其特征在于，包括以下步骤：

S41：数据准备，需准备复杂场景下小目标图像数据集，其中存在大量小目标，小目标种类有：人、自行车、轿车、面包车、卡车、三轮车、公共汽车和摩托车，训练及使用前根据卷积网络的要求，将图片统一大小，以保证后续计算顺利进行；

S42：数据增强，在进行训练之前对图像进行数据翻转和mosaic处理；

S43：采用权利要求1‑2任一项所述的一种复杂场景小目标的数据处理检测方法与YOLOv5相结合，并结合注意力机制，建立最终检测网络，训练模型，模型训练在进行梯度下降的过程中，初始学习率设置为0.01，并通过"one‑cycle policy"学习率调整策略和"AutoSelect"学习率自适应选择策略来动态改变和选择学习率，降低损失，以提高准确率；

S44：使用二元交叉熵损失函数用于对象损失，计算公式为：

，其中表示所有格子即

像素点的个数，其中表示预测的第i个格子中第j 个边界框是否包含目标,B表示每个格子预测的边界框数量，是一个指示函数，当格子i中第j个边界框包含目标时为 1，否则为 0，则表示当格子i中第j个边界框不包含目标时为 1，否则为 0；

使用二元交叉熵损失函数用于类别损失，计算公式为：

，其中表示预测的第i个格子中第j个边

界框属于第c个类别的概率，是一个指示函数，当边界框属于第c个类别时为 1，否则为

0；

使用均方误差损失用于边界框坐标损失，计算公式为：

，其中、

分别表示第i个格子中第j个边界框的预测中心的横坐标、预测中心的纵坐标、宽度和高度，、、、分别表示第i个格子中第j个边界框的真实中心的横坐标、真实中心的纵坐标、宽度和高度，t用于表示具体位置的x、y、w、h四个参数，用于计算指定位置各参数的均方差，是一个超参数，用于平衡边界框坐标损失和其他损失的权重；

使用GIOU损失函数计算预测框与真实框之间的重叠程度，计算公式为：、，

其中是一个包含预测框和真实框的最小闭合区域的面积，表示第i个格子中第j个边界框的真实坐标，表示预测的坐标，表示预测坐标与真实坐标的交集与并集的比值,用于预测的边界框与真实边界框之间的，是广义交并比；

S45：YOLOv5网络在后处理阶段使用非极大值抑制来处理网络输出的边界框；

S46：模型训练，训练每一个Epoch都包括了前向传播和后向传播，并且不断迭代，在迭代后期，学习率降低频率增快，损失逐渐降低，准确率、mAP、mAP 50缓慢增加。