欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2020104305837
申请人: 杭州电子科技大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-02-23
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于视频图像的人群计数方法,其特征在于,步骤如下:

步骤一、选取具有标注信息的行人图像数据集,测试集与训练集数量定为6:4,可以根据实际数据集对比例进行修改,然后根据图像自带的人头标注像素点进行高斯函数处理,生成原图像对应的初始真值密度图;

步骤二、搭建基于密度分类的编码-解码卷积网络模型;

所述的基于密度分类的编码-解码卷积网络模型分为一个骨干网络与两个分支:以VGG-16网络作为骨干网络,使用其全部层数提取对应不同尺度特征;通过密度回归分支对提取的不同尺度特征进行融合输入,通过回归实现密度分类,获得解码分支的权重;解码分支利用各尺度特征,上采样解码还原图像,生成各尺度特征对应的人群密度估计图,利用密度回归分支获得的权重进行加权,得到最终密度估计图;

步骤三、通过训练集对步骤二搭建的基于密度分类的编码-解码卷积网络模型进行训练,采用随机梯度下降算法来优化参数,并使用欧几里德距离来计算密度估计图和真值密度图之间的损失;保留效果较优的完整模型,用于实际检测;

步骤四、利用背景分离的预处理方法,实现输入图像的缩减,完成稀疏矩阵的生成,再通过步骤三得到的基于密度分类的编码-解码卷积网络模型,实现最终的计数结果;

背景分离的方法:通过对采集的连续视频帧与给定的背景图像进行像素减法,采用阈值划分的形式保留所有无关背景的信息的图像内容,实现输入图像内容的缩减,提高卷积效率;并通过编码-解码卷积网络模型生成的最终密度估计图,对含有行人部分进行提取,其余部分以背景形式更新至背景图层,实现背景的实时更新。

2.根据权利要求1所述的所述一种基于视频图像的人群计数方法,其特征在于,步骤一的具体内容为:利用二维高斯卷积核将数据集中的带有人头位置标注的行人图像转换为真值密度图,用于损失差计算;选择基于几何适应高斯核的密度图,公式表示如下:真值密度图通过delta脉冲函数与一个高斯函数卷积获得,先卷积后求和;xi表示人头在图像中的像素位置;δ(x-xi)表示图像中人头位置的冲激函数;N为图像中的人头总数;

为距离xi人头最近m个人头的平均距离;β为定值,用于生成高斯函数的宽度参数;

通过以上运算将带有人头标注的行人图像转换成真值密度图,并作为卷积神经网络的输出比对进行后续训练。

3.根据权利要求2所述的所述一种基于视频图像的人群计数方法,其特征在于,所述步骤三的具体内容为:利用测试集图像作为输入对步骤二搭建的基于密度分类的编码-解码卷积网络模型,进行训练,并保留模型参数;使用欧几里得距离计算最终密度估计图和真值密度图之间的损失;采用随机梯度下降算法优化参数,直到损失值收敛到预计值;

采用欧氏距离测量生成的密度图与真实值的距离时,损失函数定义如下:

其中,N表示输入编码-解码卷积网络模型的图片数量,Z(Xi;Θ)为第i幅输入图片对应的最终密度估计图,ZGT表示真值密度图;Θ表示网络待学习参数;

采用均方误差(MSE)和平均绝对误差(MAE)对编码-解码卷积网络模型进行评估;MSE用来描述编码-解码卷积网络模型的准确度,MSE越小则准确度越高,MAE能反映出预测值的误差情况;

其中,Ci表示对图片的预测人数, 表示真实人数;

测试过程:选择测试集输入到训练好的模型中进行测试,输出最终人群密度图,统计结果;取最佳结果作为模型参数进行封装。

4.根据权利要求3所述的所述一种基于视频图像的人群计数方法,其特征在于,所述步骤四的具体内容为:利用背景分离方法,将背景图像从采集的连续视频帧中减去,即输入的初始图像与背景图像做像素减法的方式得到一张差异图;该差异图包含了所有无关背景的信息,所述的所有无关背景的信息包括来往的行人、车辆、光线照射导致的阴影变化;对差异图进行阈值划分滤去光照等细小干扰,得到分离背景的感兴趣区域(ROI,region of interest);保留的ROI图像,即为输入步骤三模型中的有效图像;上述过程中实现了冗余信息的过滤,以稀疏矩阵的形式,提高了编码-解码卷积网络模型的卷积速率;

得到ROI图像的最终密度估计图后,通过人工标定的形式(根据实际情况给定)构造行人掩膜模板,利用行人掩膜模板与最终密度估计图进行数字图像处理形态学变化的膨胀操作(密度图中的高亮点与掩膜模板进行卷积,得到一个扩大后的区域,代表这当前区域存在行人)得到行人图像,对行人图像进行像素值取反的得到背景更新掩膜;利用背景更新掩膜与初始图像做点乘,得到更新背景图像,用于更新参与背景减法的背景图像,实现背景图像的在线更新;

通过步骤四对采集信息进行预处理,再通过步骤三中所选择的最佳模型进行行人检测计数;实现高效率的行人计数并回馈空间信息。

5.根据权利要求2所述的所述一种基于视频图像的人群计数方法,其特征在于,进一步的,β=0.3。