1.一种人群密度估计方法,其特征在于,包括:
将原始人群场景的RGB图像输入主干网络进行初始特征提取,得到初始特征图;
将所述初始特征图输入到注意力聚合膨胀卷积模块,得到高级特征图像,具体包括:将所述初始特征图输入到注意力聚合膨胀卷积模块中使用膨胀率不同的膨胀卷积层对图像进行卷积处理,得到尺度感知特征图像;使用注意力聚合操作学习所述尺度感知图像在空间和信道方向上的权重,得到聚合特征图;根据所述聚合特征图联结之后输入网络模型的头部模块进行计算,得到高级特征图像;
将原始人群场景的RGB图像输入小波变换模块,得到先验信息图像;
将所述高级特征图像和所述先验信息图像进行融合,得到人群密度估计结果。
2.根据权利要求1所述的人群密度估计方法,其特征在于,所述主干网络包括十层卷积层和三层池化层。
3.根据权利要求1所述的人群密度估计方法,其特征在于,所述将原始人群场景的RGB图像输入小波变换模块,得到先验信息图像,具体包括:将原始人群场景的RGB图像输入小波变换模块;
使用低通滤波器对原始人群场景的RGB图像进行卷积操作,同时在图像的水平和垂直方向使用高通滤波器,得到图像的对角线子带,将对角线小波变换的结果作为初始先验信息图像;
将所述初始先验信息图像输入三层卷积网络中进行增强,得到最终先验信息图像。
4.根据权利要求1所述的人群密度估计方法,其特征在于,所述将所述高级特征图像和所述先验信息图像进行融合,得到人群密度估计结果,具体包括:将所述高级特征图像和所述先验信息图像进行融合,得到融合结果;
将所述融合结果输入到维度变换层,使用1×1×1的卷积核进行卷积操作,得到人群密度估计结果。
5.一种人群密度估计系统,其特征在于,包括:
初始特征图确定模块,用于将原始人群场景的RGB图像输入主干网络进行初始特征提取,得到初始特征图;
高级特征图像确定模块,用于将所述初始特征图输入到注意力聚合膨胀卷积模块,得到高级特征图像,具体包括:尺度感知特征图像确定单元,用于将所述初始特征图输入到注意力聚合膨胀卷积模块中使用膨胀率不同的膨胀卷积层对图像进行卷积处理,得到尺度感知特征图像;聚合特征图确定单元,用于使用注意力聚合操作学习所述尺度感知图像在空间和信道方向上的权重,得到聚合特征图;高级特征图像确定单元,用于根据所述聚合特征图联结之后输入网络模型的头部模块进行计算,得到高级特征图像;
先验信息图像确定模块,用于将原始人群场景的RGB图像输入小波变换模块,得到先验信息图像;
人群密度估计结果确定模块,用于将所述高级特征图像和所述先验信息图像进行融合,得到人群密度估计结果。
6.根据权利要求5所述的人群密度估计系统,其特征在于,所述主干网络包括十层卷积层和三层池化层。
7.根据权利要求5所述的人群密度估计系统,其特征在于,所述先验信息图像确定模块具体包括:输入单元,用于将原始人群场景的RGB图像输入小波变换模块;
初始先验信息图像确定单元,用于使用低通滤波器对原始人群场景的RGB图像进行卷积操作,同时在图像的水平和垂直方向使用高通滤波器,得到图像的对角线子带,将对角线小波变换的结果作为初始先验信息图像;
最终先验信息图像确定单元,用于将所述初始先验信息图像输入三层卷积网络中进行增强,得到最终先验信息图像。
8.根据权利要求5所述的人群密度估计系统,其特征在于,所述人群密度估计结果确定模块具体包括:融合单元,用于将所述高级特征图像和所述先验信息图像进行融合,得到融合结果;
人群密度估计结果确定单元,用于将所述融合结果输入到维度变换层,使用1×1×1的卷积核进行卷积操作,得到人群密度估计结果。