欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2020103479780
申请人: 江西理工大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2023-12-11
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于深度学习的车辆检测与识别的方法,其特征在于,包括如下步骤:S1、采集原始车辆图片数据;

S2、制作原始训练数据集;

S3、对步骤S2得到的原始训练数据集进行数据增强,形成最终训练数据集;

S4、对Faster RCNN网络模型进行改进,改进的内容包括:

1)对Faster RCNN网络模型的共享卷积网络VGGNet-16进行改进:将共享卷积网络VGGNet-16的第3层到第13层的3×3卷积修改为Fire Module;

2)在原有的Faster RCNN网络模型的RPN网络的基础上增加6个更小的anchors,即Faster RCNN网络模型在特征图的每一像素点上抽取15种Anchors,具体尺度为(1282、2562、

5122、322、642)和3类长宽比(1:1,2:1,1:2);

3)用ROI Align代替原有的Faster RCNN网络模型中的ROI Pooling;

4)采用多尺度训练作为Faster RCNN网络模型的训练方式;

S5、利用步骤S3得到的最终训练数据集对步骤S4得到的改进后的Faster RCNN网络模型进行训练;

S6、把需要检测的车辆图像输入训练后的预测模型中,得到车辆检测结果。

2.根据权利要求1所述的基于深度学习的车辆检测与识别的方法,其特征在于,步骤S2的具体过程如下:S2.1、下载VOC2007数据集,并将步骤S1采集得到的原始车辆图片数据移动到VOC2007数据集的data文件夹下;

S2.2、使用标注工具对原始车辆图片数据进行标注,用矩形框框出原始车辆图片中的车辆,并生成xml文件,xml文件保存矩形框坐标和车辆类型,保存格式为[车辆类型,矩形框中心x坐标,矩形框中心y坐标,车辆宽度w,车辆高度h];删除难以人工标注的原始车辆图片;将得到的xml文件替换VOC2007数据集中Annotations文件夹内的文件;

S2.3、根据步骤S2.2生成的xml文件,对应生成名称为train、test、trainval和val的txt文件,用这四个txt文件替换VOC2007数据集中Main文件夹内的txt文件;

S2.4、初始化模型参数,下载预训练模型将其放在data文件夹下。

3.根据权利要求1所述的基于深度学习的车辆检测与识别的方法,其特征在于,步骤S3的具体过程为:先对原始训练数据集依次进行亮度随机调整、对比度随机调整、色相随机调整、饱和度随机调整、通道随机调换光学变换,再依次进行随机扩展、随机剪裁、随机镜像、随机到固定比例几何变换,最后进行去均值变换,得到最终训练数据集。

4.根据权利要求1所述的基于深度学习的车辆检测与识别的方法,其特征在于,所述多尺度训练中,设置三种输入尺度(600,800,1000),训练时,每张车辆图片被随机分配一种尺度。