欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2018107745422
申请人: 浙江工业大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2023-12-11
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.基于图像目标检测的物流车辆车型分类的识别方法,包括如下步骤:步骤一,通过视觉设备获取物流园区的实时影像;

步骤二,数据增强工作,在图片的指定位置对采集的物流车辆图像进行裁剪,并将图片缩放到固定的像素:宽为W,高为H;

步骤三,将统一大小的图片,经过图片数据批量标准化处理,具体过程如下:步骤3.1确定每次处理的图片数量为m张,每张图片包含有宽高的像素点信息,定义图片集合:X=[x1,x2,...xi...,xm]         (1)其中,xi为第i张图片的所有像素信息;

用以下表达式将每张二维图片像素信息按照从左往右,从上到下顺序平摊为一维像素信息:其中η=W*H,表示一张图片像素信息的总长度;xil表示第i张图片的第l位置的一维像素信息;通过将每张图片的一维像素信息缩放为0到1,得到白化处理的结果:ci=xi/255;                          (3)图片集合X的白化处理结果矩阵为:

CX=[c1,c2,...ci,...cm]                    (4)步骤3.2计算图片集合白化处理结果矩阵CX的均值:

其中,K表示当前批次;E[ci]表示当前批次中第i张图片白化处理结果的均值,即:步骤3.3计算图片集合白化处理结果矩阵CX的方差:

步骤3.4进行图片数据批量标准化处理,用于加快网络训练:

图片数据批量标准化处理结果用于神经网络的输入;

步骤四,对所述当前批次K的图片数据批量标准化结果重新转换回二维数据,即宽为W、高为H,进行卷积操作:步骤4.1设定方形卷积核的边长大小值为size,设定卷积核核心起始位置为所述二维数据矩阵左上角第一个位置,设定卷积核滑动的距离为stride,设定滑动顺序为从左到右,从上到下;

步骤4.2设定隐含层神经元的节点个数Node1,用于表示卷积核对所述当前批次二维数据进行卷积操作,实现加权求和,提取拥有节点个数的图片细节特征,卷积的计算公式为:其中r为卷积核核心在二维数据矩阵的横坐标,c为卷积核核心在二维数据矩阵的纵坐标,Kernelsize×size表示设定的卷积核,bias表示实现加权求和的偏置;

步骤五,需要对卷积操作后的特征进行激活,有目的地将有用的图片特征信息表达出来,通过给定的Relu滤波器,将大于某阈值的有用信息进行激活处理,小于阈值的进行抑制,其Relu滤波器激活公式为:Activerc=max(0,Converc)              (10)其中Activerc为激活后的对应坐标特征数据,最终激活后的坐标数据矩阵记为Active,max(0,Converc)为滤波激活函数,即矩阵中数值以所述阈值为0进行滤波,取当前值和阈值中的最大值;

步骤六,将激活后的Active数据矩阵进行池化降维操作,提高特征计算效率,池化降维操作采用最大池化操作,计算公式为:其中kernelSize×Size为设定的池化核, 表示最大池化操作,将池化核内部矩阵中最大值输出,设定与卷积不同的边长Size,r'为池化核核心在激活后的Active二维数据矩阵的横坐标,c'为池化核核心在激活后的Active二维数据矩阵的纵坐标,设定不同滑动距离Stride,在所述激活后的二维Active矩阵上进行滑动,降维后的最大池化数据维度大小计算公式为:W'=W/Stride,H'=H/Stride                 (12)其中W'为最大池化输出后的新宽度,H'为最大池化输出后的新高度;

步骤七,重复步骤四到步骤六两次,设定这两次的隐含层神经元节点数分别为Node2和节点数Node3,设定每次卷积核的大小和滑动距离等与步骤四同,设定池化核的大小和滑动距离与步骤六同,最后输出的节点大小为W”'=W/Stride3,H”'=H/Stride3;

步骤八,(W”',H”')大小对应的矩阵信息为提取的高阶图像信息,称为热图,定位特定特征属于特定分类的物流工程车辆特征,引进了滑动的建议框在这一层上进行边框回归,该建议框有9种类型,由三种尺寸和对应三种宽高比例进行组合得到9种尺度形状的建议框;通过在热图上的滑动,计算每一点不同建议框下的热图信息与真实对应的车辆类别特征进行损失的计算,定位与分类的总损失函数为:其中,Ncls表示前景的个数,而边框回归个数Nreg是最后特征图滑动的最大维度数量;i表示某一次迭代中的某一个建议框;pi表示预测出对应类别的概率,包括前景、背景; 表示前景与背景的取值,记前景 背景 这样来计算目标边框回归的损失;ti表示该建议框的坐标信息,即中心点坐标和建议框宽高ti=(xi,yi,wi,hi),而 表示真正对应的目标物体信息,同样的 Lcls为softmax分类损失函数,而λ平衡着边框回归和分类损失的权重;边框回归损失采用smooth L1的方法:

其中, 函数计算公式为: