知嘟嘟-专利交易平台_专利购买_专利出售-买专利,上嘟嘟

欢迎来到知嘟嘟！联系电话：13336804447 卖家免费入驻，海量在线求购！卖家免费入驻，海量在线求购！

嘟嘟会员

帮助中心网站地图

查出售查高校查求购查年费

我要发布

首页转移热力图Hot 专利交易委托购买高校专区科技服务专利求购年费查询行业资讯

联系电话：13336804447

知嘟嘟经纪人

基于深度卷积神经网络的人民币冠字号多标签识别方法

￥37100

专利号： 2020103814420

申请人：辽宁科技大学

专利类型：发明专利

专利状态：已下证

专利领域：核算装置

更新日期：2024-01-05

缴费截止日期：暂无

价格&联系人

年费信息

委托购买

专利简介

专利详情

委托购买说明

需准备材料

常见问题

摘要:

权利要求书:

1.基于深度卷积神经网络的人民币冠字号多标签识别方法，其特征在于，具体包括如下步骤：

1)对钞票图像进行预处理，包括改善光亮强度、提取冠字号图像以及配准冠字号图像；

2)首先使用先验知识大致定位，然后对冠字号进行准确定位，得到人民币冠字号图像；

3)将所有人民币冠字号图像缩放成预设的同一尺寸；

4)利用深度卷积神经网络对图像特征进行提取，训练模型后得到预测向量，当模型达到一定准确率时保存模型；

训练阶段将归一化的二值冠字号图像输入深度卷积神经网络中通过模型的自训练得到特征向量；将特征图拉伸输入到全连接层中得出预测向量；通过Sigmoid交叉熵函数对预测向量和标签向量进行训练，得出最终模型；

5)预测阶段将图像输入到保存的深度卷积神经网络模型中提取图像特征；

所述深度卷积神经网络模型结构如下：

首先共有4层，分别为卷积层，批正则化层，激活层，以及最大值池化层；

输入图像尺寸为(128，64，3)，其中卷积层的卷积核大小为7x7，卷积核的深度为64，卷积步长为2；

批正则化层对输入进行归一化，不改变输入的尺寸；

激活层增加了神经网络的非线性，不改变输入的尺寸；

最大池化层中采样层为3x3，步长为2，最大池化层用来缩减模型的大小，提高计算速度，同时提高所提取特征的鲁棒性；

然后是瓶颈模块，瓶颈模块中包含了九层，第一层为卷积层，第二层为批正则化层，第三层为激活层，第四层为补边层，第五层为卷积层，第六层为批正则化层，第七层为激活层，第八层为卷积层，第九层为批正则化层；

共堆叠了16个瓶颈模块；

接下来是捷径残差块，计算公式如下所示：y＝F(x，wf)*T(x，wt)+x*C(x，wc)，T(x，wt)是一种非线性变换，称作变换门，负责控制变换的强度，C(x，wc)也是一种非线性变化，称作携带门，负责控制原输入信号的保留强度，y是F和x的加权组合，T和C则分别控制着两项对应的权重，其中T+C＝1；捷径残差块很好的解决了网络深度带来的训练困难的问题；

在瓶颈模块中，跨越三层将第一层加权连接到第三层，有效的解决了深度网络中的梯度发散问题，其中捷径通道中的权重设为1；

然后是全局均值池化层，其中全局均值池化层用来减少参数数量，即减轻模型过拟合的发生；

最后是全连接层，全连接层输出高度提纯的特征，用来交给最后的分类器做分类；

6)将预测向量进行Sigmoid操作，将预测向量作Sigmoid交叉熵函数得到取值范围为0‑

1的预测向量；

7)将Sigmoid操作后的预测向量切分成十条，从每一条中找到最大值，并映射到对应的标签向量上，得出最终分类结果。

2.根据权利要求1所述基于深度卷积神经网络的人民币冠字号多标签识别方法，其特征在于，所述步骤1具体包括：灰度化的基础上结合顶帽变换以改善纸币图像二值化效果；

提取纸币图像所在的矩阵区域以去除无关的背景信息；利用单应矩阵对图像进行配准以校正倾斜和消除透视效应；

第一个图像预处理具体包括：

1)建立配准前纸币图像的四个顶角坐标与配准图像的对应关系；

2)由坐标对应关系求出单应矩阵；

3)利用单应矩阵求出配准后的纸币图像中在配准前的纸币图像的对应点；