欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2018109643387
申请人: 湖北工业大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-01-05
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于背景估计与U型卷积神经网络的文档图像二值化方法,其特征在于,包括以下步骤:

步骤1:对彩色文档图像f(x,y)进行灰度预处理,获得灰度图像fgray(x,y);

步骤2:对灰度图像fgray(x,y)进行图像增强处理,获得图像feq(x,y);

步骤3:对图像feq(x,y)进行笔画宽度变换;

步骤4:对笔画宽度变换后的图像进行形态学闭操作,估计出文档图像的背景,获得背景估计图;

步骤5:计算图像feq(x,y)与背景估计图之间的绝对差值,绝对差值图像全部取反,获得背景减除图像;

步骤6:对背景减除图像进行分割处理;

其中,采用U型卷积神经网络对背景减除图像进行分割处理,U型卷积神经网络由收缩路径与扩张路径构成,收缩路径中由10个3×3卷积核,4个2×2最大池化层组成,激活函数为线性修正单元;

线性修正单元RELU(xconv)为:其中,xconv为卷积结果;

扩张路径中使用2×2的反卷积核将特征图像的维度减半,反卷积的输出大小为:xout=(xin‑1)*s+k其中,xin为输入大小,k为卷积核大小,s为滑动步长,xout为输出大小;

通过矩阵级联的方式与收缩路径中的特征图进行拼接,并采用3×3的卷积进一步提取图像特征;由于文档图像二值化属于二分类问题,因此最后一层中选择Sigmoid函数作为激活函数,具体公式为:

其中,为输入特征, 为像素点被划分为字符的概率值;

采用对数损失函数反映网络分类的准确性,具体公式为:其中,yi为训练样本的真实值, 为训练样本的像素点被划分为字符的概率值,m为训练样本个数;

步骤7:对步骤6的输出结果进行二值化处理,实现图像二值化。

2.根据权利要求1所述的基于背景估计与U型卷积神经网络的文档图像二值化方法,其特征在于:步骤1中,采用加权平均法对彩色文档图像f(x,y)进行灰度预处理;具体灰度预处理公式为:

fgray(x,y)=0.299fR(x,y)+0.587fG(x,y)+0.114fB(x,y)其中,fR(x,y)、fG(x,y)、fB(x,y)分别代表彩色文档图像f(x,y)的R、G、B分量。

3.根据权利要求1所述的基于背景估计与U型卷积神经网络的文档图像二值化方法,其特征在于:步骤2中,采用线性灰度变换对灰度图像fgray(x,y)进行图像增强处理;具体公式为:

其中,图像fgray(x,y)中灰度值小于l1的累计分布概率为1%,小于l2的累计分布概率为

99%,h1=0、h2=255为灰度变换图像的最小值与最大值。

4.根据权利要求1所述的基于背景估计与U型卷积神经网络的文档图像二值化方法,其特征在于:步骤3中,采用Canny算子对图像feq(x,y)进行边缘检测,得到每一个边缘像素点p的梯度方向dp,沿射线r=p±n·dp方向寻找对应的边缘像素点q,将路径 上的像素点赋值为p与q之间的欧式距离||p‑q||,除非该像素点已经被指定了一个更小的宽度值,图像的笔画宽度估计SWE的具体计算公式为:其中,num表示笔画宽度变换的输出s(x,y)中不为0的个数,n>0。

5.根据权利要求1所述的基于背景估计与U型卷积神经网络的文档图像二值化方法,其特征在于:步骤4中,使用圆形结构元素对笔画宽度变换后的图像进行形态学闭操作。

6.根据权利要求1‑5任意一项所述的基于背景估计与U型卷积神经网络的文档图像二值化方法,其特征在于:选择全局最优阈值处理方法,对U型卷积神经网络输出结果进行二值化处理;具体实现包括以下子步骤:步骤7.1:统计灰度直方图;

统计图像的灰度直方图分布,直方图中各分量表示为pi(i=0,1,2,...,L‑1),其中L为

256;

步骤7.2:计算前景像素点、背景像素点比例;

选择一个阈值k∈[0,L‑1],计算前景像素点所占总像素点比例 计算背景像素点所占总像素点的比例

步骤7.3:计算灰度平均值;

计算前景像素点的灰度平均值μ1(k)与背景像素点的灰度平均值μ2(k),具体公式为:步骤7.4:确定阈值;

类间方差作为背景像素点与前景像素点的可分性度量,根据步骤7.2‑7.3计算类间方差 找到使得 最大的k作为阈值,实现图像二值化;具体公式为:其中 为全局均值。