1.一种标准化考场监控的单帧图像中考生定位和计数方法,其特征在于由下述步骤组成:(1)利用标准化考场监控视频制作单帧的考场图像数据集将标准化考场监控视频按不同的考场划分,每个考场提取2帧图像,2帧图像的时间间隔为10~100分钟,人工标注出每幅图像中考生所在位置及其类别标签,构成标注文件,图像与其对应的标注文件构成考场图像数据集,将考场图像数据集按比例参数值随机划分为训练集和测试集;
(2)图像预处理
利用双线性插值法,将训练集和测试集中所有图像的像素均缩放为300×300;
(3)构建基于Keras深度学习框架下的SSD网络
构建Keras深度学习框架下SSD网络的步骤为:
(a)设置SSD网络参数
设置训练集与测试集的比例参数为0.7~0.9、分类数为21、训练集的训练时期为300~
500次、训练批次尺寸为16、基础学习率参数为0.0003、学习率衰减因子为0.9;
(b)在Keras深度学习框架下,构建SSD网络作为图像特征提取和图像目标检测的网络;
(4)采用考场图像数据集训练SSD网络
通过训练考场图像数据集训练SSD网络的步骤为:
(a)预训练
采用VOC2007数据集对SSD网络进行预训练,获取预训练后的权重和偏置,将该权重和偏置替代随机初始化的SSD网络的权重和偏置;
(b)设置SSD网络中的所有卷积层、池化层、全连接层训练属性值,参与训练则训练属性值为1,不参与训练则训练属性值为0;
(c)采用步骤(2)预处理后的训练集训练SSD网络
将按步骤(2)预处理后的训练集,包括图像及其对应的标签文件,输入SSD网络,设定交叉熵函数为损失函数,使用梯度下降法降低损失值来进行前向传播和反向传播,反复循环前向传播和反向传播,并更新网络的权重值和偏置,直至达到设定的训练时期300~500次,得到训练好的SSD网络;
(5)用训练好的SSD网络测试步骤(2)预处理后的测试集的图像(a)设置测试参数
设置目标的类别置信度阈值为0.5~0.65;
(b)测试
将步骤(2)预处理后的测试集内的图像输入到训练好的SSD网络中进行测试,得到图像中目标的初始检测结果即每个目标的位置坐标、21分类中的类别和所属类别的置信度;
(c)对SSD网络输出的分类结果进行2分类归类
对于SSD网络输出的初始检测结果中,分类类别为“人”的目标归为“人”类,分类类别属于剩余20类的目标全部归为一类,记为“背景”类;
(d)对2分类后的检测结果筛选
一次筛选,删除属于“背景”类的目标的位置坐标信息、类别信息和所属类别的置信度信息,保留属于“人”类的目标的位置坐标信息、类别信息和所属类别的置信度信息;二次筛选,在一次筛选的结果中保留类别置信度大于置信度阈值的目标的位置坐标信息、类别信息和所属类别的置信度信息,删除类别置信度低于阈值的目标的位置坐标信息、类别信息和所属类别的置信度信息;
(e)输出计数结果和考生位置
统计图像中类别为“人”类且类别置信度大于置信度阈值的目标的数量,并输出数量,根据目标的位置信息,输出考生定位结果图。
2.根据权利要求1所述的标准化考场监控的单帧图像中考生定位和计数方法,其特征在于:所述的步骤(1)中标准化考场监控视频为某高校近3年来标准化考场监控视频,且每个考场监控视频中选取的2帧图像的时间间隔为30分钟。
3.根据权利要求1所述的标准化考场监控的单帧图像中考生定位和计数方法,其特征在于:所述的步骤(3)的步骤(a)中,训练集与测试集比例参数为0.9;训练集训练时期为500次。
4.根据权利要求1所述的标准化考场监控的单帧图像中考生定位和计数方法,其特征在于:所述的步骤(4)的步骤(b)中,SSD网络的前7个卷积层和前3个池化层,即卷积层1_1、卷积层1-2、卷积层2-1、卷积层2-2、卷积层3-1、卷积层3-2、卷积层3-3,池化层1、池化层2、池化层3的训练属性值设为0。
5.根据权利要求1所述的标准化考场监控的单帧图像中考生定位和计数方法,其特征在于:所述的步骤(5)的步骤(a)中,目标的类别置信度阈值为0.56。