欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2020105122000
申请人: 湖北工业大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-01-05
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于深度可分离卷积残差块和改进NMS的多尺度目标检测方法,其特征在于,包括如下步骤:步骤1,获取若干图片,作为原始图像数据,对原始图像数据中的检测目标进行边框和类别的标注;

步骤2,对于步骤1中的原始图像数据进行数据增强操作,将新生成的图片与步骤1中采集到的图片一起作为训练图片;

步骤3,利用特征提取网络提取训练图片的特征图,将步骤2中的训练图片分批进行特征提取;其中特征提取网络包含依次连接的卷积层、深度可分离残差块(1)、深度可分离残差块(2)、深度可分离残差块(3)、深度可分离残差块(4)、深度可分离残差块(5)、深度可分离残差块(6),所述深度可分离残差块(1)—(6)均由深度卷积、点卷积和残差网络组成;

步骤4,将步骤3得到的特征图送入多尺度检测网络中,在不同大小的特征图上生成不同尺度、不同宽高比的预测框来拟合图片中的待测目标;

步骤5,对步骤4生成的预测框,采用非极大值抑制NMS进行多余预测框剔除,得到待测目标的唯一标识框;

步骤6,重复步骤3~5对由特征提取网络、多尺度检测网络以及NMS组成的整个模型进行迭代训练;

步骤7,当所有的训练图片均已通过整个模型,输出此时的检测准确率;

步骤8,对比每次输出的准确率,如果准确率持续上升,则继续训练;如果准确率保持不变或有下降趋势,则停止训练,并保存最终输出的整个模型。

2.如权利要求1所述的一种基于深度可分离卷积残差块和改进NMS的多尺度目标检测方法,其特征在于:步骤2中采用水平镜像、随机裁剪、随机亮度和对比度增强的数据增强操作来产生更多训练图片。

3.如权利要求2所述的一种基于深度可分离卷积残差块和改进NMS的多尺度目标检测方法,其特征在于:其中水平镜像表示将图片的左右部分以图像垂直中轴线为中心进行镜像对换;随机裁剪表示将原图像裁剪成多张包含待检测目标的不同大小图片;随机亮度是调节图像亮度以削弱光照不均匀所带来的影响,图片亮度Li通过颜色空间R、G、B的均值来表示,Li越大代表亮度越高,其变换过程的表达式如下:其中,bri代表变换后的亮度,k为亮度变化系数,通过设置不同的k值完成对Li的调节,k小于1表示亮度减弱,k大于1表示亮度增强,因此将各颜色通道的值同比例增减即可改变图像的亮度。

4.如权利要求1所述的一种基于深度可分离卷积残差块和改进NMS的多尺度目标检测方法,其特征在于:步骤4中先对NMS进行改进,然后利用改进的NMS进行多余预测框剔除,具体实现方式如下:首先将得到的预测框的置信度从高到低排序,令B为步骤4生成的预测框集合,S为每个预测框对应的置信度分数,选出当前最高置信度和其对应的预测框,然后遍历其余的预测框,将遍历到的预测框置信度使用以下公式进行重置,重置公式如下:其中,si'为重置之后的预测框置信度,预测框置信度得分si,M为当前得分最高的预测框,bi为遍历到的预测框,D为所有M的集合,IoU(M,bi)的计算过程为:其中,A(M)代表得分最高的预测框的面积,A(bi)代表遍历到的预测框的面积,∩代表取交集操作,∪代表取并集操作;

当重置后的得分si大于阈值Nt时,将此时遍历到的预测框从集合B中删除,同时将其置信度分数也从S集合中删除,直到所有的预测框均被扫描过时结束。

5.如权利要求1所述的一种基于深度可分离卷积残差块和改进NMS的多尺度目标检测方法,其特征在于:步骤5中的多尺度检测网络采用SSD模型,包括1层8*8卷积层,1层4*4卷积层,1层2*2卷积层,1层1*1卷积层。