知嘟嘟-专利交易平台_专利购买_专利出售-买专利,上嘟嘟

欢迎来到知嘟嘟！联系电话：13095918853 卖家免费入驻，海量在线求购！卖家免费入驻，海量在线求购！

嘟嘟会员

帮助中心网站地图

查出售查高校查求购查年费

我要发布

首页转移热力图Hot 专利交易委托购买高校专区科技服务专利求购年费查询行业资讯

联系电话：13095918853

知嘟嘟经纪人

基于背景估计与U型卷积神经网络的文档图像二值化方法

￥50300

专利号： 2018109643387

申请人：湖北工业大学

专利类型：发明专利

专利状态：已下证

专利领域：计算；推算；计数

更新日期：2024-01-05

缴费截止日期：暂无

价格&联系人

年费信息

委托购买

专利简介

专利详情

委托购买说明

需准备材料

常见问题

摘要:

权利要求书:

1.一种基于背景估计与U型卷积神经网络的文档图像二值化方法，其特征在于，包括以下步骤：

步骤1：对彩色文档图像f(x,y)进行灰度预处理，获得灰度图像fgray(x,y)；

步骤2：对灰度图像fgray(x,y)进行图像增强处理，获得图像feq(x,y)；

步骤3：对图像feq(x,y)进行笔画宽度变换；

步骤4：对笔画宽度变换后的图像进行形态学闭操作，估计出文档图像的背景，获得背景估计图；

步骤5：计算图像feq(x,y)与背景估计图之间的绝对差值，绝对差值图像全部取反，获得背景减除图像；

步骤6：对背景减除图像进行分割处理；

其中，采用U型卷积神经网络对背景减除图像进行分割处理，U型卷积神经网络由收缩路径与扩张路径构成，收缩路径中由10个3×3卷积核，4个2×2最大池化层组成，激活函数为线性修正单元；

线性修正单元RELU(xconv)为：其中，xconv为卷积结果；

扩张路径中使用2×2的反卷积核将特征图像的维度减半，反卷积的输出大小为：xout＝(xin‑1)*s+k其中，xin为输入大小，k为卷积核大小，s为滑动步长，xout为输出大小；

通过矩阵级联的方式与收缩路径中的特征图进行拼接，并采用3×3的卷积进一步提取图像特征；由于文档图像二值化属于二分类问题，因此最后一层中选择Sigmoid函数作为激活函数，具体公式为：

其中，为输入特征，为像素点被划分为字符的概率值；

采用对数损失函数反映网络分类的准确性，具体公式为：其中，yi为训练样本的真实值，为训练样本的像素点被划分为字符的概率值，m为训练样本个数；

步骤7：对步骤6的输出结果进行二值化处理，实现图像二值化。

2.根据权利要求1所述的基于背景估计与U型卷积神经网络的文档图像二值化方法，其特征在于：步骤1中，采用加权平均法对彩色文档图像f(x,y)进行灰度预处理；具体灰度预处理公式为：

fgray(x,y)＝0.299fR(x,y)+0.587fG(x,y)+0.114fB(x,y)其中，fR(x,y)、fG(x,y)、fB(x,y)分别代表彩色文档图像f(x,y)的R、G、B分量。

3.根据权利要求1所述的基于背景估计与U型卷积神经网络的文档图像二值化方法，其特征在于：步骤2中，采用线性灰度变换对灰度图像fgray(x,y)进行图像增强处理；具体公式为：

其中，图像fgray(x,y)中灰度值小于l1的累计分布概率为1％，小于l2的累计分布概率为

99％，h1＝0、h2＝255为灰度变换图像的最小值与最大值。

4.根据权利要求1所述的基于背景估计与U型卷积神经网络的文档图像二值化方法，其特征在于：步骤3中，采用Canny算子对图像feq(x,y)进行边缘检测，得到每一个边缘像素点p的梯度方向dp，沿射线r＝p±n·dp方向寻找对应的边缘像素点q，将路径上的像素点赋值为p与q之间的欧式距离||p‑q||，除非该像素点已经被指定了一个更小的宽度值，图像的笔画宽度估计SWE的具体计算公式为：其中，num表示笔画宽度变换的输出s(x,y)中不为0的个数，n＞0。

5.根据权利要求1所述的基于背景估计与U型卷积神经网络的文档图像二值化方法，其特征在于：步骤4中，使用圆形结构元素对笔画宽度变换后的图像进行形态学闭操作。

6.根据权利要求1‑5任意一项所述的基于背景估计与U型卷积神经网络的文档图像二值化方法，其特征在于：选择全局最优阈值处理方法，对U型卷积神经网络输出结果进行二值化处理；具体实现包括以下子步骤：步骤7.1：统计灰度直方图；

统计图像的灰度直方图分布，直方图中各分量表示为pi(i＝0,1,2,...,L‑1)，其中L为

256；

步骤7.2：计算前景像素点、背景像素点比例；

选择一个阈值k∈[0,L‑1]，计算前景像素点所占总像素点比例计算背景像素点所占总像素点的比例

步骤7.3：计算灰度平均值；

计算前景像素点的灰度平均值μ1(k)与背景像素点的灰度平均值μ2(k)，具体公式为：步骤7.4：确定阈值；

类间方差作为背景像素点与前景像素点的可分性度量，根据步骤7.2‑7.3计算类间方差找到使得最大的k作为阈值，实现图像二值化；具体公式为：其中为全局均值。