欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2019101485549
申请人: 江南大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2023-10-10
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于多尺度特征卷积神经网络的目标定位方法,其特征在于,步骤如下:步骤1、将任意大小的单尺度图像I输入卷积神经网络ConNet,利用特征金字塔模型以及梯度类平均映射Grad‑CAM算法,计算分类的交叉熵误差Lcross‑entrop,计算相对应的引导反向传播梯度 卷积神经网络ConNet每一层输出为{C2,C3,...,Cl},通过主干卷积c

网络计算预测类别c,针对类别的得分为y ,输入图像I的大小w*h;其多层特征图与输出相对应为{F2,F3,...,Fl};

步骤2、计算每一层的重要性权重 在多层特征图上计算像素级空间强度并利用ReLU激活函数

网络计算预测输出类别c,求出每一个类别c的得分相对于所有特征层的梯度得分,即c k

输出y 对于卷积层l的特征图Fl的偏导 将偏导信息进行全局平均池化操作处理得到其中,每个特征图的对应子块k对应的池化范围为i,j,可知:对每个层级下的不同特征图,其对应是{m,n,k},即单个特征的长宽和通道数;经过激活函数ReLU层,

获得当前梯度金字塔每层的梯度特征图步骤3、针对每层梯度金字塔,进行上采样和横向连接操作,求出叠加后的像素级空间强度,即 具体为:

在每个梯度特征图 进行两步操作:首先,将其上采样为两倍,使其与下一层梯度图形状相同;之后与下一层梯度特征图 进行横向连接增强浅层特征强度与深层特征强度进行融合;每层之间的操作为:

其中, 表示上采样函数,图像内插值方法;

对于最底部的梯度特征图输出,得到:其中,L表示网络层数;

最高层特征图相对于底层特征图拥有更大的权重,因为高层特征图的语义信息更加集中,能够捕捉更多的视觉结构;图层间横向连接,梯度强度逐级增强;

步骤4、针对叠加后的 在计算热力图后,计算全局峰值γ,以缩放因子σ进行缩放,作为局部最大阈值;对每个热力图应用最大滤波器和最小滤波器,对应计算最大均值滤波后的 和最小均值滤波后的 并计算差分热力图,将差异不变像素点置0,以获得具有局部最大质心的可能区域;

步骤5、经过多次膨胀,生成多个候选点,找出最佳质心,然后利用缩放后的全局峰值进行梯减;

步骤6、围绕梯减后的最大边界,选出最大矩形框的坐标[xmin,ymin,xmax,ymax];输出所有图像的目标预测类别Dclass和坐标合集Dloc。

2.根据权利要求1所述的目标定位方法,其特征在于,所述步骤1中,特征金字塔模型中金字塔结构主要包括两个方面:第一方面在前馈计算上的自下而上的路径,计算由尺度步长为2的多尺度特征映射组成的特征层级,同时,选择每个阶段的最后一层的输出作为特征映射参考集;对于ResNet网络,使用每个阶段的残差输出的特征激活;对于不同卷积层,残差块的输出为{C2,C3,...,Cl},步长分别为{S2,S3,...,Sl}个像素;第二方面是特征图上的自顶向下的路径和特征层间的横向连接;高层特征相对粗糙但是语义信息更强,通过自顶向下的路径和横向连接增强特征映射,进行更精确的定位;在空间分辨率上上采样为2倍,然后通过元素相加将上采样信息与当前层信息合并;迭代完成这个过程,直至金字塔构建;

特征映射集为{P2,P3,...,Pl},对应于{C2,C3,...,Cl},分别具有相同的大小。