1.一种基于编码‑解码结构多尺度卷积神经网络的人群计数方法,其特征在于,包括以下步骤:步骤1,采集场景的图像,考虑图像的视角扭曲,采用自适应高斯滤波器,计算图像的真值密度图;
步骤2,采用编码‑解码结构,搭建多尺度卷积神经网络模型,用于计算人群的人员数量;其中,所述多尺度卷积神经网络模型的损失函数包括像素空间损失和计数误差描述;
步骤3,根据步骤1采集的图像以及其对应的真值密度图,对步骤2搭建的多尺度卷积神经网络模型进行训练和测试,获得训练好的多尺度卷积神经网络模型;
步骤4,将待估图像输入步骤3训练好的多尺度卷积神经网络模型,预测获得人群密度图;对人群密度图进行回归估计,获得待估图像的人员数量;
其中,步骤2搭建的多尺度卷积神经网络模型中:
编码器通过多尺度卷积模块捕获多尺度特征,用于从原始图像中学习与尺度相关的特征,实现多尺度信息的有效获取;
采用空洞空间金字塔池化模块聚合尺度特征,用于避免细节信息的丢失;
解码器对编码器的输出进行上采样,并与前半层的输出特征图经1x1卷积匹配通道数后融合,再经一个3x3的卷积核微调,进行输出,获得预测密度图;
所述空洞空间金字塔池化模块,采用4个并行的不同扩张比率的空洞卷积核对不同尺度特征进行重采样,揭示图像的上下文信息;在空洞卷积尾部串行空间金字塔结构,用于将不同大小特征图映射为相同维度空间信息融入图像表示中;
所述空洞卷积是在标准卷积核中添加空洞,空洞卷积表达式为:式中,w代表卷积核;k代表卷积核尺寸;w[k]表示大小为k的卷积核;a[i]表示第i个输入;*l表示空洞卷积运算;l表示扩张率;
步骤2的所述多尺度卷积神经网络模型的损失函数中,
采用像素空间损失LD反映估计的密度图像素级别的准确程度,表达式为:式中,Di表示第Ki,i=1......M幅训练样本图像的真值密度图,FD(Ki;θ)表示第Ki,i=
1......M幅训练样本图像的网络输出,θ表示网络的可学习参数;M表示训练图像数量;
采用计数误差描述LY增强网络对计数的敏感性,表达式为:式中,FY(Kiθ;)表示第Ki,i=1......M幅训练样本图像经由预测密度图FD(Ki;θ)积分求和后得到的预测人数,Yi表示第Ki,i=1......M幅训练样本图像的真值人数;
总损失函数L表达式为:
L(θ)=LD(1‑λ)(θ)+λLY(θ),
式中,λ表示计数损失的权值。
2.根据权利要求1所述的一种基于编码‑解码结构多尺度卷积神经网络的人群计数方法,其特征在于,步骤1中具体包括:步骤1.1,采集的图像x中第i个坐标为xi的人头标记点,表示为函数δ(x‑xi);对于一张具有N个人头标记点的图像,表示为H(x)函数,表达式为:步骤1.2,考虑图像的视角扭曲,采用自适应高斯滤波器Gσ与H(x)函数进行卷积,获得密度图方程,表达式为:第i个坐标为xi的人头标记点的自适应高斯核表达式为:式中,是标记点xi与其最近的K个人头之间的平均距离。
3.根据权利要求2所述的一种基于编码‑解码结构多尺度卷积神经网络的人群计数方法,其特征在于,步骤1.2中,参数β=0.3。
4.根据权利要求1所述的一种基于编码‑解码结构多尺度卷积神经网络的人群计数方法,其特征在于,所述多尺度卷积模块采用四个并列的1x1、3x3、5x5、7x7卷积核聚合上下文语义信息,获取尺度信息。
5.根据权利要求1所述的一种基于编码‑解码结构多尺度卷积神经网络的人群计数方法,其特征在于,λ的取值为0.5。