欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2019106480378
申请人: 北京工业大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2025-03-05
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种聚焦关键区域的深度学习目标检测方法,其特征在于,包括如下步骤:步骤S1,在模型训练阶段,首先用卷积神经网络对图像进行特征提取,得到低层特征图;

步骤S2,使用区域提议网络对低层特征图进行提议区域选取,得到类别为非背景的提议区域;

步骤S3,用轮廓检测技术得到关键区域轮廓,计算提议区域到关键区域的距离;

步骤S4,根据距离计算出惩罚权重并代入区域提议网络的损失函数,加大对偏离关键区域的提议区域的惩罚力度;

步骤S5,使用非极大值抑制移除重复预测的提议区域;

步骤S6,把提议区域和低层特征图输入到兴趣区域池化层,得到各个提议区域形状相同的特征;

步骤S7,把各个提议区域形状相同的特征图输入到全连接层,得到每个提议区域的类别和边界框;

步骤S8,在模型测试阶段,使用上述步骤训练好的网络来进行对目标的类别和位置进行检测。

2.根据权利要求1所述的聚焦关键区域的深度学习检测方法,其特征在于,所述步骤S1中在模型训练阶段,首先用卷积神经网络对图像进行特征提取,得到低层特征图包括:采用VGG16网络来提取输入图片的特征,输出的形状记为1×c1×h1×w1,c1、h1、w1分别为特征图的通道数、高、宽。

3.根据权利要求1所述的聚焦关键区域的深度学习检测方法,其特征在于,所述步骤S2中使用区域提议网络对低层特征图进行提议区域选取,得到类别为非背景的提议区域包括:使用填充为1的3×3卷积层对低层特征图进行通道数变换,并将输出通道数记为c2;这样,低层特征图中的每个单元均得到一个长度为c2的新特征;以特征图每个单元为中心,设置多个不同大小和宽高比的锚框;用3×3卷积层在锚框的基础上进行区域提议。

4.根据权利要求1所述的聚焦关键区域的深度学习检测方法,其特征在于,所述步骤S3中用轮廓检测技术得到关键区域轮廓,计算提议区域到关键区域的距离包括:对于输入图像I,使用图像轮廓检测技术对其进行关键区域轮廓检测,得到轮廓集其中nCI为关键区域的个数, 为轮廓的点集,xj和yj分别为点集中每个点在原图中的x轴、y轴坐标,nCIP为点集里点的数量;

对于区域提议网络提出的提议区域边界框

其中nBbox为提议区域的数量, 和 分别为提议区域边界框的左上角和右下角坐标,对于其中每个提议区域边界框Bboxi首先计算其中心坐标距离各关键区域的最小距离 令原图I的长和宽为HI和WI,接下来将 进行归一化得到归一化最小距离

5.根据权利要求1所述的聚焦关键区域的深度学习检测方法,其特征在于,所述步骤S4中根据距离计算出惩罚权重并代入区域提议网络的损失函数,加大对偏离关键区域的提议区域的惩罚力度:计算区域提议阶段预测为非背景的边界框的惩罚权重,对于距离关键区域较远的提议区域应当分配较高的惩罚权重,离关键区域近的提议区域应当分配较小的惩罚权重,使用高斯加权的方式使得权重的变化更加平缓,每个边界框的惩罚权重为:其中e为自然常数,σ为所有边界框到关键区域的归一化最小距离的标准差;归一化最小距离为最后,将各边界框的惩罚权重带入区域提议网络的损失函数中:

其中Ncls为小批量批次的样本数量, 为类别损失函数,pi, 分别为第i个提议区域的预测为非背景的概率和真实标签,0代表背景,1代表非背景,Nreg为锚框的位置数量, 为锚框位置坐标预测的平滑L1回归损失,ti, 分别为边界框的预测坐标和真实坐标,λ为平衡分类损失和位置损失的系数;其中分类损失 为:其中,round(pi)指pi的四舍五入值,即当前提议区域预测结果为非背景时,对其添加惩罚权重,预测为背景的提议区域不分配权重。

6.根据权利要求1所述的聚焦关键区域的深度学习检测方法,其特征在于,所述步骤S5中使用非极大值抑制移除重复预测的提议区域包括:使用非极大值抑制,从预测类别为非背景的预测边界框中移除相似的结果;最终输出的预测边界框即兴趣区域池化层所需要的提议区域。

7.根据权利要求6所述的聚焦关键区域的深度学习检测方法,其特征在于,所述步骤S6中把提议区域和低层特征图输入到兴趣区域池化层,得到各个提议区域形状相同的特征包括:假设网络生成了n个提议区域;这些形状各异的提议区域在低层特征图上分别标出形状各异的兴趣区域;这些兴趣区域需要抽取出形状相同的特征以便于连结后输出;假设高和宽均分别指定为h2和w2;输出形状为n×c2×h2×w2的特征图。

8.根据权利要求1所述的聚焦关键区域的深度学习检测方法,其特征在于,所述步骤S7中把各个提议区域形状相同的特征图输入到全连接层,得到每个提议区域的类别和边界框包括:通过全连接层将输出形状变换为n×d,其中d=c2×h2×w2;

预测类别时,将全连接层的输出的形状再变换为n×q,并使用softmax函数回归;q为类别个数;

预测边界框时,将全连接层的输出的形状变换为n×4;也就是说,为每个提议区域同时预测类别和边界框。

9.根据权利要求8所述的聚焦关键区域的深度学习检测方法,其特征在于,所述步骤S8包括:使用聚焦关键区域的损失函数训练目标检测网络之后,在测试阶段,使用该网络来对目标的类别和位置进行检测。