欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2018111690865
申请人: 燕山大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-02-23
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于卷积神经网络的人数统计方法,其特征在于,该方法包括以下步骤:(1)对图像样本数据进行灰度化预处理、分块,并生成多幅基于人头的人群密度图;其中,人群密度图中每个人头目标用一个圆形高斯核表示,高斯核的中心位于人头目标的中心位置,将人群密度图中所有人头目标对应的高斯核叠加在一起即可得到基于人头的人群密度图;

(2)将步骤(1)分块处理后的图像样本数据输入卷积神经网络中的第一个卷积层,再将结果输入到第二个卷积层;

(3)建立层次上下文和多尺度特征融合网络:

(3.1)将上一层的输出结果输入到卷积神经网络中的第一子网络;

(3.2)将上一层的输出结果输入到卷积神经网络中的转置卷积层;

(3.3)将上一层的输出结果和第一子网络中第一个池化层输出结果以及第一子网络中第三个卷积层输出结果在通道维度上链接在一起;

(3.4)将步骤(3.1)的输出结果输入到卷积神经网络中的全连接层,采用交叉熵函数作为全连接层的损失函数;

(3.5)将步骤(2)输出结果输入到卷积神经网络中的第二子网络;其中,步骤(3.3)的输出结果和第二子网络中第三个卷积层输出结果在通道维度上链接在一起;第二子网络中第

1个卷积层输出结果输入到第二子网络中第一次池化层,其输出结果和第二子网络中第6个卷积层输出结果在通道维度上链接在一起,第二子网络中第二个卷积层输出结果和第二子网络中第1个转置卷积层输出结果在通道维度上链接在一起;

(3.6)将上一层的输出结果输入到卷积神经网络中的维度变换层,获得给定图像对应的人群密度估计图和人数估计统计结果;其中,采用人群密度估计图和步骤(1)的人群密度图的欧氏距离作为维度变换层的损失函数;

(3.7)采用步骤(3.4)中交叉熵损失函数和步骤(3.6)中欧氏距离损失函数的加权和作为整体损失函数,利用步骤(1)的人群密度图对网络的全连接层输出结果和维度变换层输出结果同时进行训练;

(4)使用训练后的模型对任意输入单幅图像进行人数统计。

2.根据权利要求1所述的一种基于卷积神经网络的人数统计方法,其特征在于,步骤(1)的具体步骤包括:

1a)对图像样本数据中的图像进行灰度化,计算公式如下:

Gray=R*0.299+G*0.587+B*0.114

式中,R、G和B为彩色图像三通道值,Gray为灰度化后的图像,

并通过对数据进行图像分块,增加样本数据量,

1b)将所有人头目标对应的高斯核叠加在一起生成实际的人群密度图,计算公式如下:式中,设x为单幅图像上任意像素,xg为人头所在像素,S为人所在位置周围的像素集合,Gσ为标准差为σ的二维高斯核,δ(x-xg)为脉冲函数,*为卷积运算,D(x)获得的图像对应的人群密度图。

3.根据权利要求1所述的一种基于卷积神经网络的人数统计方法,其特征在于,步骤(2)包含两个卷积层,尺寸分别为9*9和7*7,分别生成16张和32张特征图,32张特征图为预处理特征图。

4.根据权利要求1所述的一种基于卷积神经网络的人数统计方法,其特征在于,所述第一子网络包含了五个卷积层和两个池化层。

5.根据权利要求4所述的一种基于卷积神经网络的人数统计方法,其特征在于,所述第一子网络依次包含一个卷积层,一个池化层,三个卷积层,一个池化层和一个卷积层;其中卷积层卷积尺寸依次分别为9*9、7*7、7*7、7*7和7*7,生成的特征图通道数分别为:16、32、

16、20和8,两个池化层步长均为2,第五个卷积层后生成分类特征图。

6.根据权利要求1所述的一种基于卷积神经网络的人数统计方法,其特征在于,所述全连接层为三个,神经元数量分别为:512、256和10。

7.根据权利要求1所述的一种基于卷积神经网络的人数统计方法,其特征在于,所述第二子网络包括六个卷积层、两个转置卷积层和两个池化层。

8.根据权利要求1所述的一种基于卷积神经网络的人数统计方法,其特征在于,所述第二子网络依次包含一个卷积层,一个池化层,三个卷积层,一个池化层,两个卷积层,两个转置卷积层;其中卷积层卷积尺寸依次分别为7*7、5*5、5*5、5*5、3*3和3*3,生成的特征图通道数分别为16、32、16、32、24和16,两个池化层步长均为2;两个转置卷积层的卷积尺寸均为

4*4,生成的特征图通道数分别为24和8,步长均为2。

9.根据权利要求1所述的一种基于卷积神经网络的人数统计方法,其特征在于,所述维度变换层为一个1*1的卷积核层。

10.根据权利要求1所述的一种基于卷积神经网络的人数统计方法,其特征在于,步骤(3.7)的具体操作步骤为:利用步骤(3.6)的人群密度估计图和步骤(1)的人群密度图的欧氏距离作为维度变换层的损失函数,N为训练样本数量,FD(Xi;Θ)为步骤(3.6)生成的人群密度估计图,Di为步骤(1)生成的真实的人群密度图,对每一张单幅图像的人群密度估计图和真实的人群密度图求绝对差值,并对所有图像的绝对差值的总和求平均,得到损失函数的结果,计算公式如下:利用步骤(1)处理后的人群密度图对建立的层次上下文和多尺度特征融合网络进行训练,得到待学习参数Θ的估计,设置权重项β,使得交叉熵函数和欧氏距离加权和结果最小,训练步骤如下:

1)根据图像样本数据中的图像和标记,确定每张图像的人群密集程度,查找所有样本数据中包含人数最多的图像,最多人数值记为gmax,查找所有样本数据中包含人数最少的图像,最少人数值记为gmin,通过对最多人数值和最少人数值作差并除以人群密集程度总类别数T得到密集区间Λ,计算公式如下:每张包含人数为M的图像对应的人群密集程度t可通过如下计算公式得出:

2)为建立的层次上下文和多尺度特征融合网络的参数随机设定一个初始值,设置权重项β,使得交叉熵函数LC和欧氏距离LD加权和结果最小,计算公式如下:L(Θ)=LD+βLC

待学习参数Θ采用随机梯度下降法在每一次优化迭代中更新,直到加权和结果L(Θ)收敛到一个较小的值,保存参数及训练后的模型。