1.一种基于多光谱成像技术的低质量文档图像二值化方法,其特征在于,包括以下步骤:步骤1:读取待处理文档的多光谱图像,并做线性归一化处理,获得到光谱分量图像;
步骤2:对光谱分量图像进行阈值化处理;包括局部对比度增强处理、高对比度像素检测处理、笔画宽度估计处理和局部精细二值化处理;
步骤3:目标检测;包括对步骤2中处理后的光谱分量图像进行光谱图像特征提取、估计自适应相干图像、基于梯度算子的图像阈值化和消除误判处理;
步骤3的具体实现包括以下子步骤:
步骤3.1:基于步骤2中处理后的光谱分量二值图像B0(x,y)进行光谱图像特征提取处理;
步骤3.1.1:基于步骤2中处理后的光谱分量二值图像B0(x,y)估计多光谱图像前景像素灰度平均值μFG、背景像素灰度平均值μBG及其差值Δ=μFG-μBG;
步骤3.1.2:计算多光谱图像背景像素间的协方差矩阵:Σ=E[(I-μBG)T(I-μBG)],
其中,I表示多光谱图像灰度矩阵,T表示矩阵转置,E表示数学期望;
步骤3.1.3:估计其广义逆矩阵Σ-1,使同时满足以下条件:步骤3.2:估计自适应相干图像;
基于步骤3.1提取的多光谱图像特征,估计自适应相干图像 计算公式为:并将其动态范围限制在[0,1]之间,即:
步骤3.3:基于梯度算子的图像阈值化;
步骤3.2输出图像 在位置(x,y)处的梯度定义为:其中, 和 分别表示图像 沿x和y方向的一阶导数;
针对梯度图像进行高对比度像素检测处理、笔画宽度估计处理和局部精细二值化处理,获得二值化输出图像B1(x,y);
步骤3.4:消除误判处理;
步骤3.4.1:基于步骤3.2估计的自适应相干图像 进行全局最优阈值化处理,得到二值图像B′1(x,y);
步骤3.4.2:将二值图像B0(x,y)和B′1(x,y)同时标记为前景的像素点视为真正的前景像素TP,并以此删除B0(x,y)中所有的伪前景点,得到二值图像B2(x,y):其中, 为w×w邻域内检测出的TP前景像素总数, 为w×w邻域内预先确定的TP像素下限值;
步骤4:阈值图像融合处理;包括二值图像融合和图像后处理。
2.根据权利要求1所述的基于多光谱成像技术的低质量文档图像二值化方法,其特征在于:步骤1中所述获得到光谱分量图像,包括1个紫外光谱:340nm,3个可见光谱:500nm、
600nm、700nm,4个红外光谱:800nm、900nm、1000nm、1100nm。
3.根据权利要求1或2所述的基于多光谱成像技术的低质量文档图像二值化方法,其特征在于,步骤1中所述线性归一化处理,计算公式如下:其中,I(x,y)和I′(x,y)分别表示归一化前、后的图像灰度值,Imax和Imin分别表示光谱分量图像的灰度最大值和最小值。
4.根据权利要求1所述的基于多光谱成像技术的低质量文档图像二值化方法,其特征在于,步骤2的具体实现包括以下子步骤:步骤2.1:对光谱分量图像进行局部对比度增强处理,计算公式如下:其中,C(x,y)表示图像的局部对比度,Imax(x,y)和Imin(x,y)分别表示图像在以(x,y)为中心的3×3邻域内的灰度最大值和最小值;
步骤2.2:对于步骤2.1的输出图像进行高对比度像素检测处理;
对于步骤2.1的输出图像,记t∈[0,L-1]为图像前景与背景的分割阈值,L为灰度级分辨率;如果前景像素占图像比例 前景像素平均灰度值 背景像素占图像比例 背景像素平均灰度值 则图
像的总体平均灰度值为 其中,pi表示归一化直方图;
定义前景和背景图像的类间方差为:
实现高对比度像素检测的准则是,通过确定全局最优阈值t0,使分割后的前景和背景差异最大,即:步骤2.3:基于步骤2.2检测出的高对比度像素进行笔画宽度估计处理;
步骤2.3.1:基于步骤2.2检测出的高对比度像素,利用Canny算子对图像进行边缘检测,每个边缘像素点p都具有一个方向梯度值dp;
步骤2.3.2:如果像素点p位于笔画边缘,计算p的方向梯度dp,并沿着射线r=p±n×dp梯度查找与之对应的另一个边缘像素点q,计算q的方向梯度dq,dp与dq的方向是大致相反的,即: 其中n≥0;
步骤2.3.3:执行下述判断;
如果边缘像素点p找不到对应匹配的q或者其方向梯度dp与dq不满足大致相反的要求,则舍弃该射线r;
如果边缘像素点p找到对应匹配的q或者其方向梯度dp与dq满足大致相反的要求,则在[p,q]路径上的每个像素点都指定为笔画宽度属性值,即欧式距离dist=||p-q||,除非该像素点已经被指定了一个更小的笔画宽度属性值;
步骤2.3.4:重复步骤2.3.2,直到计算出所有未被舍弃路径上的像素笔画宽度值,并统计其分布直方图H(dist),则笔画宽度估计为:SWE=argmax[H(dist)];
步骤2.4:基于步骤2.3估计的字符笔画宽度进行局部精细二值化处理;
基于步骤2.3估计的字符笔画宽度确定滑动邻域窗尺寸,从而实现字符前景与页面背景的精细分割,具体公式为:其中, 为w×w邻域内检测出的高对比度像素总数, 为w×w邻域内由文档字符笔画宽度确定的最少像素下限值,I(x,y)为图像(x,y)处的灰度值,μw(x,y)和σw(x,y)分别表示以(x,y)为中心的w×w邻域内光谱分量图像的灰度平均值和标准偏差,B0(x,y)表示获得的二值图像。
5.根据权利要求1所述的基于多光谱成像技术的低质量文档图像二值化方法,其特征在于,步骤4的具体实现包括以下子步骤:步骤4.1:二值图像融合;
针对二值图像B1(x,y)和B2(x,y),采用以下公式进行二值图像融合:其中,B(x,y)为融合后的二值图像;
步骤4.2:图像后处理
去除字符笔画边缘少于10个像素的椒盐噪声,并填充字符笔画内部少于10个像素的笔画空洞。