1.基于深度卷积神经网络的人民币冠字号多标签识别方法,其特征在于,具体包括如下步骤:
1)对钞票图像进行预处理,包括改善光亮强度、提取冠字号图像以及配准冠字号图像;
2)首先使用先验知识大致定位,然后对冠字号进行准确定位,得到人民币冠字号图像;
3)将所有人民币冠字号图像缩放成预设的同一尺寸;
4)利用深度卷积神经网络对图像特征进行提取,训练模型后得到预测向量,当模型达到一定准确率时保存模型;
5)预测阶段将图像传入到深度卷积神经网络中提取图像特征;
6)将特征图拉伸输入到全连接层中得出预测向量;
7)将预测向量进行Sigmoid操作;
8)将作Sigmoid操作后的预测向量切分成十条,从每一条中找到最大值,并映射到对应的标签向量上,得出最终分类结果。
2.根据权利要求1所述基于深度卷积神经网络的人民币冠字号多标签识别方法,其特征在于,所述步骤1具体包括:灰度化的基础上结合顶帽变换以改善纸币图像二值化效果;
提取纸币图像所在的矩阵区域以去除无关的背景信息;利用单应矩阵对图像进行配准以校正倾斜和消除透视效应;
第一个图像预处理具体包括:
1)建立配准前纸币图像的四个顶角坐标与配准图像的对应关系;
2)由坐标对应关系求出单应矩阵;
3)利用单应矩阵求出配准后的纸币图像中在配准前的纸币图像的对应点;
4)采用双线性插值法对匹配后的纸币图像赋值。
3.根据权利要求1所述基于深度卷积神经网络的人民币冠字号多标签识别方法,其特征在于,所述步骤2具体包括:利用先验知识大致定位在配准图像左方1/4和下方1/3的矩形区域;采用基于分块二值化的精准定位,即将大致定位图分成左右两块并分别使用全局阈值进行二值化,再拼合起来进行扫描定位。
4.根据权利要求1所述基于深度卷积神经网络的人民币冠字号多标签识别方法,其特征在于,所述步骤4具体包括:训练阶段将归一化的二值冠字号图像输入深度卷积神经网络中通过模型的自训练得到特征向量;将特征图拉伸输入到全连接层中得出预测向量;通过Sigmoid交叉熵函数对预测向量和标签向量进行训练,得出最终模型。
5.根据权利要求1所述基于深度卷积神经网络的人民币冠字号多标签识别方法,其特征在于,所述步骤5具体包括:预测阶段将图像输入到保存的深度卷积神经网络模型中提取图像特征。
6.根据权利要求5所述基于深度卷积神经网络的人民币冠字号多标签识别方法,其特征在于,所述深度卷积神经网络模型结构如下:首先共有4层,分别为卷积层,批正则化层,激活层,以及最大值池化层;
输入图像尺寸为(128,64,3),其中卷积层的卷积核大小为7x7,卷积核的深度为64,卷积步长为2;
批正则化层对输入进行归一化,不改变输入的尺寸;
激活层增加了神经网络的非线性,不改变输入的尺寸;
最大池化层中采样层为3x3,步长为2,最大池化层用来缩减模型的大小,提高计算速度,同时提高所提取特征的鲁棒性;
然后是瓶颈模块,瓶颈模块中包含了九层,第一层为卷积层,第二层为批正则化层,第三层为激活层,第四层为补边层,第五层为卷积层,第六层为批正则化层,第七层为激活层,第八层为卷积层,第九层为批正则化层;
共堆叠了16个瓶颈模块;
接下来时是捷径残差快,在瓶颈模块中,跨越三层将第一层加权连接到第三层,有效的解决了深度网络中的梯度发散问题。其中捷径通道中的权重设为1;
然后是全局均值池化层,其中全局均值池化层用来减少参数数量,即减轻模型过拟合的发生;
最后是全连接层,全连接层输出高度提纯的特征,用来交给最后的分类器做分类。
7.根据权利要求1所述基于深度卷积神经网络的人民币冠字号多标签识别方法,其特征在于,所述步骤6具体包括:将特征图拉伸输入到全连接层中得出预测向量。
8.根据权利要求1所述基于深度卷积神经网络的人民币冠字号多标签识别方法,其特征在于,所述步骤7具体包括:将预测向量作Sigmoid交叉熵函数得到取值范围为0-1的预测向量。
9.根据权利要求1所述基于深度卷积神经网络的人民币冠字号多标签识别方法,其特征在于,所述步骤8具体包括:将向量切分成10条,从每条中找到最大值,并映射到对应的标签向量上,然后输出预测结果。