1.一种基于背景估计与U型卷积神经网络的文档图像二值化方法,其特征在于,包括以下步骤:
步骤1:对彩色文档图像f(x,y)进行灰度预处理,获得灰度图像fgray(x,y);
步骤2:对灰度图像fgray(x,y)进行图像增强处理,获得图像feq(x,y);
步骤3:对图像feq(x,y)进行笔画宽度变换;
步骤4:对笔画宽度变换后的图像进行形态学闭操作,估计出文档图像的背景,获得背景估计图;
步骤5:计算图像feq(x,y)与背景估计图之间的绝对差值,绝对差值图像全部取反,获得背景减除图像;
步骤6:对背景减除图像进行分割处理;
其中,采用U型卷积神经网络对背景减除图像进行分割处理,U型卷积神经网络由收缩路径与扩张路径构成,收缩路径中由10个3×3卷积核,4个2×2最大池化层组成,激活函数为线性修正单元;
线性修正单元RELU(xconv)为:其中,xconv为卷积结果;
扩张路径中使用2×2的反卷积核将特征图像的维度减半,反卷积的输出大小为:xout=(xin‑1)*s+k其中,xin为输入大小,k为卷积核大小,s为滑动步长,xout为输出大小;
通过矩阵级联的方式与收缩路径中的特征图进行拼接,并采用3×3的卷积进一步提取图像特征;由于文档图像二值化属于二分类问题,因此最后一层中选择Sigmoid函数作为激活函数,具体公式为:
其中,为输入特征, 为像素点被划分为字符的概率值;
采用对数损失函数反映网络分类的准确性,具体公式为:其中,yi为训练样本的真实值, 为训练样本的像素点被划分为字符的概率值,m为训练样本个数;
步骤7:对步骤6的输出结果进行二值化处理,实现图像二值化。
2.根据权利要求1所述的基于背景估计与U型卷积神经网络的文档图像二值化方法,其特征在于:步骤1中,采用加权平均法对彩色文档图像f(x,y)进行灰度预处理;具体灰度预处理公式为:
fgray(x,y)=0.299fR(x,y)+0.587fG(x,y)+0.114fB(x,y)其中,fR(x,y)、fG(x,y)、fB(x,y)分别代表彩色文档图像f(x,y)的R、G、B分量。
3.根据权利要求1所述的基于背景估计与U型卷积神经网络的文档图像二值化方法,其特征在于:步骤2中,采用线性灰度变换对灰度图像fgray(x,y)进行图像增强处理;具体公式为:
其中,图像fgray(x,y)中灰度值小于l1的累计分布概率为1%,小于l2的累计分布概率为
99%,h1=0、h2=255为灰度变换图像的最小值与最大值。
4.根据权利要求1所述的基于背景估计与U型卷积神经网络的文档图像二值化方法,其特征在于:步骤3中,采用Canny算子对图像feq(x,y)进行边缘检测,得到每一个边缘像素点p的梯度方向dp,沿射线r=p±n·dp方向寻找对应的边缘像素点q,将路径 上的像素点赋值为p与q之间的欧式距离||p‑q||,除非该像素点已经被指定了一个更小的宽度值,图像的笔画宽度估计SWE的具体计算公式为:其中,num表示笔画宽度变换的输出s(x,y)中不为0的个数,n>0。
5.根据权利要求1所述的基于背景估计与U型卷积神经网络的文档图像二值化方法,其特征在于:步骤4中,使用圆形结构元素对笔画宽度变换后的图像进行形态学闭操作。
6.根据权利要求1‑5任意一项所述的基于背景估计与U型卷积神经网络的文档图像二值化方法,其特征在于:选择全局最优阈值处理方法,对U型卷积神经网络输出结果进行二值化处理;具体实现包括以下子步骤:步骤7.1:统计灰度直方图;
统计图像的灰度直方图分布,直方图中各分量表示为pi(i=0,1,2,...,L‑1),其中L为
256;
步骤7.2:计算前景像素点、背景像素点比例;
选择一个阈值k∈[0,L‑1],计算前景像素点所占总像素点比例 计算背景像素点所占总像素点的比例
步骤7.3:计算灰度平均值;
计算前景像素点的灰度平均值μ1(k)与背景像素点的灰度平均值μ2(k),具体公式为:步骤7.4:确定阈值;
类间方差作为背景像素点与前景像素点的可分性度量,根据步骤7.2‑7.3计算类间方差 找到使得 最大的k作为阈值,实现图像二值化;具体公式为:其中 为全局均值。