1.一种复杂场景下的试卷分割算法,其特征在于,其步骤为:
1)由原始图像通过灰度变换以及边缘检测算法得到图像边缘;
2)通过图像边缘计算连通区域以及其外接矩形;
3)根据不同连通区域外接矩形的IOU合并连通区域;
4)基于卷积神经网络构建字符判别模型,指导连通区域合并,合并后连通区域外接矩形分割字符区域;
5)利用步骤4)分割结果,通过文本线构造法分割文本行区域;
6)基于卷积神经网络构建题号判别模型,结合步骤5)分割结果分割试题区域。
2.根据权利要求1所述的一种复杂场景下的试卷分割算法,其特征在于:所述的步骤1)中,具体方法为:
1.1)将原始图像O通过颜色图像空间转换为灰度图像G;
1.2)通过边缘检测算法提取G的图像边缘E。
3.根据权利要求1所述的一种复杂场景下的试卷分割算法,其特征在于:所述的步骤2)中,具体方法为:
2.1)提取E的连通区域集A,其中A由n个小连通区域Ai组成,即A={Ai},i∈[1,n],且当i≠j时Ai≠Aj;
2.2)计算Ai的外接矩形Di,记作Di=F(Ai),其中Di=(Xi,Yi,Wi,Hi),Xi,Yi,Wi,Hi分别表示Di左上顶点横坐标、左上顶点纵坐标、Di的宽度、Di的高度。
4.根据权利要求1所述的一种复杂场景下的试卷分割算法,其特征在于:所述的步骤3)中,具体方法为:
3.1)计算Di与Dj的IOU,其中Dj∈{Di|i∈[1,n],i≠j};
3.2)设置阀值α,如果IOU>α,则Di←F(Ai∪Aj)且D←D-{Dj}。
5.根据权利要求1所述的一种复杂场景下的试卷分割算法,其特征在于:所述的步骤4)中,具体方法为:
4.1)通过卷积神经网络构建二分类字符判别模型M1;
4.2)M1判别结果
4.3)设置参数β,
如果R1=M1(Di)=0且K={Aj|j∈[1,n],i≠j,Di与Dj中心距离<β},则计算R'1=M1(F(Ai∪K));
我中K为:与元素Ai外接矩形Di中心距离<β的元素Aj的集合;
如果R'1=0,则D←D-{Di},否则Di←F(Ai∪K)且D←D-K。
6.根据权利要求1所述的一种复杂场景下的试卷分割算法,其特征在于:所述的步骤5)中,具体方法为:
5.1)D中每两个相近的元素Di与Dj形成一组,合并不同组直到无法合并为止,将合并结果记为L,即L←D;
5.2)设置参数γ和δ,Di与Dj形成一组需要DiΘDj且DjΘDi成立,其中DiΘDj需要满足:①Di是D中距离Dj最小元素,且距离小于γ,②Di和Dj的垂直重合度大于δ。
7.根据权利要求1所述的一种复杂场景下的试卷分割算法,其特征在于:所述的步骤6)中,具体方法为:
6.1)通过卷积神经网络构建二分类题号判别模型M2;
6.2)M2判别结果
6.3)按照Yi由小到大排序,以(Xi,Yi)为左上顶点,取Hi×Hi大小矩形区域记为Ti,计算R2=M2(Ti),如果R2=1,则合并{Lk|k∈[1,i-1]}且L←L-{Lk|k∈[1,i-1]},合并结果记为Q。