1.一种引入字库文字图像进行深度模板匹配的汉字识别方法,其特征在于:包括以下步骤:
A:对汉字矢量字库中每个文字,根据该文字的矢量图形,生成对应的文字图像,定义为字库文字图像,并保存该字库文字图像对应的文字内容;然后进入步骤B;
B:对汉字矢量字库中每个文字,获取该文字对应的真实字符图像集合;然后进入步骤C;
C:令batch表示一个能够存放K个元组的容器,初始时batch置空;令maxIter为最大迭代次数;model表示训练阶段得到的文字识别模型,初始时model置空;然后进入步骤D;
D:进行maxIter次循环,且在每次循环中,随机挑选K组文字内容相同或不同的字库文字图像和真实字符图像的组合,然后判断当前文字识别模型model是否为空;
若当前文字识别模型model为空,则利用双通道孪生神经网络,在当前容器batch中的数据上,从零开始训练模型,模型训练完成后,将该模型保存为更新后的文字识别模型model;若当前文字识别模型model非空,则利用双通道孪生神经网络,在当前容器batch中的数据上,更新已有文字识别模型model,并保存为更新后的文字识别模型model;
当每次循环结束后,将容器batch中的内容清空;当maxIter次循环全部结束后,最终得到更新后的文字识别模型model,用于预测输入的两幅图像中的文字内容相同的概率,然后进入步骤E;
E:创建一个键值对数据结构map,键值对数据结构map的键为文字内容cls,键值对数据结构map的值为对应的预测概率值prob;令测试集中的图像数量为m,进行m次循环;在每次循环中,首先从测试集中读取下一幅真实字符图像a,然后将map置空,进入步骤F;
F:对拟预测文字内容的真实字符图像a,依次将真实字符图像a与汉字矢量字库中的每个字库文字图像b组成二元组(a,b),并将二元组(a,b)送入步骤D中得到的更新后的文字识别模型model中,利用更新后的文字识别模型model得到真实字符图像a与字库文字图像b属于同一个文字内容的预测概率值prob;然后将字库文字图像b对应的文字内容cls及预测概率值prob的值存入键值对数据结构map中,即map[cls]=prob;当真实字符a与汉字矢量字库中的所有字库文字图像比对结束后,输出当前键值对数据结构map中预测概率值最大的前N个文字内容,作为真实字符图像a的最终文字识别结果。
2.根据权利要求1所述的引入字库文字图像进行深度模板匹配的汉字识别方法,其特征在于:所述的步骤A中,根据所选取的汉字矢量字库中每个文字的矢量图形,利用计算机程序,将对应文字的矢量图形打印到一幅背景透明的空白图像中,并保存为.png格式。
3.根据权利要求1所述的引入字库文字图像进行深度模板匹配的汉字识别方法,其特征在于:所述的汉字矢量字库为宋体汉字矢量字库。
4.根据权利要求1所述的引入字库文字图像进行深度模板匹配的汉字识别方法,其特征在于:所述的步骤B中,真实字符图像从真实图像或扫描文档中,通过手工标注或剪切得到的文字的图像。
5.根据权利要求1所述的引入字库文字图像进行深度模板匹配的汉字识别方法,其特征在于:所述的maxIter = 600000 ,K为32、64或128。
6.根据权利要求1所述的引入字库文字图像进行深度模板匹配的汉字识别方法,其特征在于,所述的步骤D包括以下具体步骤:D1:当容器batch中的元组数量小于K时,从汉字矢量字库中的字库文字图像中随机挑选一幅字库文字图像t,并获取该字库文字图像t所对应的文字内容c;在{0,1}集合中随机选择一个数字r,若r =1,则从文字内容c所对应的真实字符图像集合中,随机挑选一幅真实字符图像s,并将三元组(t,s,1)保存到容器batch中,三元组中的t和s表示输入的两幅图像,0和1为两种可能的输出值, 1表示字库文字图像t和真实字符图像s的文字内容相同;如果r=0,则从除了文字内容c之外的其它所有文字内容的真实字符图像集合中,随机挑选一幅真实字符图像f,并将三元组(t,f,0)保存到容器batch中,三元组中的t和f表示输入的两幅图像,0和1为两种可能的输出值,0表示字库文字图像t和真实字符图像f中的文字内容不同;
重复上述步骤,直到容器batch中的元组数量等于K;然后进入步骤D2;
D2:判断当前文字识别模型model是否为空;若当前文字识别模型model为空,则利用双通道孪生神经网络,在当前容器batch中的数据上,从零开始训练模型,模型训练完成后,将该模型保存为更新后的文字识别模型model;若当前文字识别模型model非空,则利用双通道孪生神经网络,在当前容器batch中的数据上,更新已有文字识别模型model,并保存为更新后的文字识别模型model;然后进入步骤D3;
D3:当每次循环结束后,将容器batch中的内容清空;然后进入步骤D4;
D4:当maxIter次循环全部结束后,最终得到更新后的文字识别模型model,用于预测输入的两幅图像中的文字内容相同的概率,然后进入步骤E。
7.根据权利要求1所述的引入字库文字图像进行深度模板匹配的汉字识别方法,其特征在于:所述的步骤F中,N=5。