欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2019111734745
申请人: 浙江理工大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-01-05
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于Faster R-CNN改进算法的车辆检测方法,包括如下步骤:A1,采集车辆数据集,车辆数据集包含物体Ground Truth(GT)框的多幅图像I,物体对象为车辆,GT框数据为(c*,x*,y*,w*,h*),c*表示GT框内物体的类别,x*,y*分别表示GT框内中心点的x坐标和y坐标,w*,h*分别表示GT框的高度和宽度;

A2,使用维度聚类方法对GT框的宽和高进行聚类,生成聚类后的框宽和高尺寸;

A3,特征融合:将图像I输入到基本单元为深度可分离卷积(depthwise separable convolution,DSC)的轻量级卷积网络MobileNet中进行特征提取得到不同尺度的特征图,将不同尺度的特征图相融合;

A4,利用A3中得到的特征图,输入到RPN网络进行候选框预测;

A4-1,用滑动窗口在A3中得到的特征图上进行卷积,滑动窗口的中心为锚点,以每个锚点作为中心由A2产生的框宽和高尺寸生成固定数量的不同尺寸的框作为锚框,每个滑动窗口卷积后生成一个固定维度的特征;

A4-2,将A4-1中生成的特征输入到两个全连接层,一个全连接层输出是图像中车辆的预测概率p,另一个全连接层通过边框回归的方法输出候选框及其相对于锚框的位置偏移量t;

A4-3,标签和偏移量设定:锚框的真实值标签设为p*,将不同尺寸的锚框,通过计算锚框和GT框之间的交并比(Intersection-over-Union,IOU),根据交并比确定锚框为正样本还是负样本而设置真实值标签p*;把标定为正样本的锚框与GT框之间的偏移量设为t*;

A4-4,基于A4-2中得到的预测概率p,对候选框按照预测概率p按由高到低的顺序进行排序,输出排序高的若干候选框;

A5,利用A3中得到的特征图和A4-4中得到的候选框输入到检测网络中进行检测;

A6,重复步骤A3~A5,将图像I输入到由RPN网络和检测网络组成的Faster R-CNN改进模型中,通过梯度下降最小化损失函数进行训练,使得预测的候选框和GT框相匹配;针对未知物体GT框的待测图像,输入到训练后的Faster R-CNN改进模型中,得到候选框的类别置信度分数及其候选框的位置坐标,作为车辆物体的检测结果。

2.根据权利要求1所述的一种基于Faster R-CNN改进算法的车辆检测方法,其特征是:所述A2具体为:

A2-1,聚类输入的原始数据是GT框数据,数据中每行都包含是GT框的中心点, 是GT框的宽和高,N是所有GT框的

个数。

A2-2,首先初始化k个聚类中心centroid(Wi,Hi),i∈(1,2,…,k),k即为需要生成的锚框个数,Wi和Hi分别是聚类中心点的宽和高的尺寸;

A2-3,通过计算GT框与聚类中心点的距离,把GT框划分到与之最近的一个簇中,计算GT框box与聚类中心距离d时,选用两者之间的交并比值作为距离指标,距离计算公式为:d(box,centroid)=1-IOU(box,centroid);

A2-4,所有GT框划分完毕后,对每个簇重新计算聚类中心,更新聚类中心的值(Wi,Hi),更新为当前簇中的所有GT框的宽和高的均值,计算方式为Ni是第i个簇的GT框个数;

A2-5,重复A2-3和A2-4步骤,直到聚类中心改变量收敛,得到k个聚类中心点(Wi,Hi),即得到k个锚框的宽和高的尺寸。

3.根据权利要求1所述的一种基于Faster R-CNN改进算法的车辆检测方法,其特征是:所述A3具体为:

A3-1,特征提取网络是MobileNet,对输入图片进行多次卷积和池化操作,将最大尺度特征图通过池化减小维度,将最小尺度特征图通过反卷积增大维度;

A3-2,将处于尺度最大、中间和最小的特征图进行特征叠加融合。

4.根据权利要求1所述的一种基于Faster R-CNN改进算法的车辆检测方法,其特征是:所述A4-3中,当锚框与GT框的交并比大于0.7或者锚框与GT框的交并比为最大值时,认为该锚框为物体,标签p*为正样本;当锚框与GT框的交并比小于0.3时,认为该锚框为背景,标签*p为负样本。

5.根据权利要求1所述的一种基于Faster R-CNN改进算法的车辆检测方法,其特征是:所述步骤A4中,建立RPN网络的损失函数,损失函数是由分类损失函数和回归损失函数组成;

分类损失函数为:

其中,i是锚框的索引,pi是第i个锚框是物体的预测概率, 是第i个锚框的真实值标签,Lcls是分类损失,Ncls为分类样本数量;

回归损失函数为:

其中,ti是预测候选框与锚框的偏移量,是GT框与锚框的偏移量,Nreg为偏移量的数据总数,Lreg是回归损失, R表示具有鲁棒性的Smooth L1损失函数;

总损失函数为:

其中,λ为比例系数。