1.在线笔迹认证中一种笔迹布局特征的提取及认证方法,其特征在于:包括如下步骤:
A)手写笔迹笔画布局特征预学习:收集人群关于标准汉字c的大量的手写笔迹样本,基于笔画识别算法识别所有预学习手写笔迹样本中的笔画类型;然后提取每段笔画的布局特征、两两笔画之间的布局特征、两两笔画之间是否相交以及交叉点的布局特征;以所识别的笔画类型为对象,分析各种笔画布局特征在人群中出现的统计特征,对笔画布局的离散型特征,包括笔画类型、两两笔画相交的次数特征,统计这类特征在人群中出现的分布律;对笔画布局的连续型特征,包括交叉点的位置特征、两两笔画间的布局特征,估算这些特征在人群中出现的联合概率密度函数;
所述手写笔迹样本是指通过专用的数据传感设备实时采集书写过程中笔尖运动产生的各种信息所获得的与时间相关的时序信号序列,专感器在每个采样时刻采集的数据包括笔尖的二维位置信息、笔尖施加在书定平面上的压力、笔杆与书写平面的转动角及夹角信息;
所述每段笔画的布局特征是指笔迹中某一段笔画的方位角、包含该笔画的面积最小矩形的长度和宽度、笔画在书写平面中的位置特征,所述两两笔画之间的布局特征是指笔迹中任意两段笔画之间的其中一段笔画的起止点、交叉点相对另一段笔画的长度、夹角、重心距离特征;
所述笔画的布局特征包括笔迹中所包含的所有笔画、笔画的起点和终点的位置、笔画之间的交叉点位置、笔迹中所有单笔画的布局特征、笔迹中所有两两笔画之间的布局特征;
所述汉字c的手写笔迹样本是指书写人手写的可被其他人正确辩识的或只能被少数人辩识的或只能被书写者自己辩识为标准汉字c的非标准手写体笔迹,所谓辩识是指建立手写体笔迹与标准汉字之间的对应关系;
所述识别手写笔迹中的笔画类型是指建立手写笔迹中笔画与标准汉字中笔画的对应关系;
B)笔画布局特征注册:注册用户书写并提交关于标准汉字c的若干注册手写笔迹样本,设若干所述注册手写笔迹样本组成注册手写笔迹样本集合,识别所有注册手写笔迹样本中的笔画类型,按所识别的笔画类型,提取每段笔画的布局特征、两两笔画之间的布局特征、两两笔画之间是否相交以及交叉点的布局特征,统计笔画布局特征中各种离散型特征在所有注册手写笔迹样本集合中出现和未出现的次数,统计笔画布局特征中各种连续型特征在注册手写笔迹样本集合中的最大、最小值;
所述注册手写笔迹样本是指在注册阶段注册用户书写并提交的用户身份已知的手写笔迹,所述用户身份已知是指手写笔迹书写者的身份是已知的;
C)笔画布局特征认证:待认证用户提交一个关于标准汉字c的测试手写笔迹样本,识别测试手写笔迹样本中的笔画类型,按所识别的笔画类型,统计测试手写笔迹样本中出现和未出现的笔画类型,统计两两笔画之间出现和未出现的交叉点,提取所有具有相同笔画类型的各种单笔画布局特征以及两两笔画间的布局特征,找出注册手写笔迹样本中稳定且一致的各种笔画布局特征,依据在手写笔迹笔画布局特征预学习阶段计算得到的汉字c所有各种笔画布局特征在人群中的统计特征,计算观测到测试手写笔迹样本与注册手写笔迹样本中所有稳定且一致的各种笔画布局特征的概率,依据计算得到的所述概率,结合其它笔画特征,包括笔画书写动态特征、笔顺、书写节奏,综合判断测试手写笔迹样本是否为真实笔迹;
所述稳定且一致笔画布局特征包括离散型稳定且一致笔画布局特征和连续型稳定且一致笔画布局特征;
所述离散型稳定且一致笔画布局特征是指,在测试手写笔迹样本中提取的离散型笔画布局特征取值与在注册手写笔迹样本集合中提取的稳定的离散型笔画布局特征取值是相同的,所述稳定的离散型笔画布局特征是指具有相同离散型笔画布局特征的特征取值在注册手写笔迹样本集合上出现次数大于一定阈值;
所述连续型稳定且一致笔画布局特征是指,在测试手写笔迹样本中提取的连续型笔画布局特征取值处于在注册手写笔迹样本集合上提取的稳定的连续型笔画布局特征取值的最大最小值之间,所述稳定的连续型笔画布局特征是指在注册手写笔迹样本集合上提取的连续型笔画布局特征取值的最大最小值之间的距离小于一定阈值;
所述测试手写笔迹样本是指在认证阶段待认证用户书写并提交的用户身份未知且有待确认的手写笔迹,所述用户身份未知是指还未确认书写手写笔迹的用户身份与模板笔迹的用户身份是否相一致,有待进一步确认;
所述待认证用户是指真实身份未得到确认的用户。
2.根据权利要求1所述在线笔迹认证中一种笔迹布局特征的提取及认证方法,其特征在于:所述步骤A)中,手写笔迹笔画布局特征预学习包括如下步骤:A1)特征预学习开始:设S={s1,s2,...,sN}表示海量的足够多书写者手写的关于标准汉字c的笔迹样本集合,每位书写者提供1至3个样本,设T={t1,t2,...,tO}表示汉字c包含的所有基本笔画集合,O表示标准汉字c所包含的基本笔画数;所述标准汉字c是目前已被广泛使用的具有标准书写样式和表现形式的汉字;
A2)初始化:置循环变量i=1,置标准汉字c的第j段笔画在预训练样本集S中出现的次数计数变量nj=0,1≤j≤O,置标准汉字c的第j段笔画在预训练样本集S中未出现的次数计数变量 1≤j≤O,置同时包含两段特定笔画类型的统计量N1O×O=0O×O,其中矩阵元素n1kj表示预训练样本集S中同时包含两段笔画被分别识别为第k段和第j段笔画类型的预训练笔迹样本个数,1≤k≤O,1≤j≤O,置笔画相交统计矩阵和未相交统计矩阵RO×O=0O×O,其中rij表示在预训练样本集S中具有这种特性的笔迹样本个数, 表示预训练样本集S中不具有这种特性的笔迹样本个数,所述特性是指在该笔迹样本中被识别为标准汉字c的第i和第j段的两段笔画之间相交,初始化总体被识别为第k段类型的单笔画布局特征集合GF1k为空,k=1,2,...,O,初始化总体两两笔画间的布局特征集合矩阵GF2O×O中每一个元素GF2kj为空,1≤k≤O,1≤j≤O,其中矩阵的第k行第j列元素GF2kj表示预训练样本集S中被识别为第k段和第j段笔画之间的布局特征集合;
A3)识别第i个预训练样本si的笔画类型,并更新统计量:对预训练样本si按笔画进行分割,得到笔画序列 识别si中每一段笔画的类型,设 表示返回的笔画类型识别结果,其中ok表示预训练样本si中的第k段笔画被识别为标准汉字c的第ok段笔画,1≤ok≤O,ni表示si中的笔画数,O表示标准汉字c包含的基本笔画数,若第k段笔画出现在预训练样本si中,则计数变量nk=nk+1,否则, 变量k从标准汉字c的第1段笔画开始到标准汉字c最后一段笔画结束,一轮循环后,完成预训练样本si对统计量nk和 的更新,为了计算交叉点出现频率,更新统计量N1O×O,若预训练样本si中存在两段笔画被分别识别为第k段和第j段笔画类型,则n1kj=n1kj+1,其中n1为矩阵N1O×O第k行第j列元素,按从左到右,从上到下的顺序完成预训练样本si对统计量N1O×O的更新;
A4)预训练样本si中两两笔画交叉点计算:以预训练样本si的笔画序列
笔画类型识别结果 人工标注的标准汉字c中应相交
笔画矩阵CO×O作为输入参数,得到预训练样本si的两两笔画间交叉点矩阵PO×O,和与预训练样本si中被识别为第k段笔画相交的交叉点集合Wk,k=1,2,...,O;若预训练样本si中被识别为第k段和第j段笔画不相交,那么交叉点矩阵PO×O中元素ptkj=0,交叉点集合Wk和Wj中交叉点pkj=(null,null)和pjk=(null,null);否则,交叉点矩阵PO×O中元素ptkj=1,交叉点集合Wk和Wj中交叉点pkj和pjk为叉交点二维坐标,1≤j≤O,1≤k≤O;
A5)笔画交叉信息的统计量更新:从步骤A4)返回的两两笔画间交叉点矩阵PO×O的第1行第1列元素开始,按从左到右,从上到下的顺序,逐个读取PO×O的元素,若预训练样本sk中存在两段笔画被分别识别为第k和第j笔画类型,ptkj=1且pkj=(null,null),那么否则,若pkj≠(null,null),表示相应的两段笔画有相交,rkj=rkj+1,双重循环结束后,完成预训练样本si对统计量矩阵RO×O和 的更新;
A6)预训练样本si中单个笔画的布局特征计算:以预训练样本si的笔画序列
笔画类型识别结果 作为输入参数,得到预训练样本si
的被识别为第k段笔画类型的笔画布局特征向量F1k,k=1,2,...,O;若预训练样本si中存在笔画被识别为第k段笔画类型,则F1k=(xg,yg,a,b,Angle,Ux,Uy,P1U,PcU);否则,F1k=null,
1≤k≤O;
A7)单笔画布局特征统计量的更新:将在预训练样本si上得到的各个笔画布局特征向量F1k,k=1,2,...,O添加到相应的总体单笔画布局特征集合中去GF1k,从第一段笔画开始到第O段笔画结束,若F1k==null,表示预训练样本si中没有笔画被识别为第k段笔画类型,不用更新,否则,GF1k=GF1k∪{F1k},循环结束后,完成对总体单笔画布局特征集合GF1k的更新,k=1,2,...,O;
A8)预训练样本si中两两笔画间的布局特征计算:具体地,以预训练样本si的笔画序列笔画类型识别结果 与预训练样本si中被识别为第k段笔画相交的交叉点集合Wk,k=1,2,...,O,预训练样本si中两两笔画间的交叉点矩阵PO×O作为输入参数,得到预训练样本si的两两笔画间布局特征向量矩阵F2O×O,若预训练样本si中存在两段笔画被识别为第k段和第j段笔画类型,则f2kj=(DisTS,DispTS,AngleTS,TD,R,P1U,PcU,PTU);否则,f2kj=null,k=1,2,...,O,1≤j≤O;
A9)两两笔画间布局特征统计量的更新:将在预训练样本si上得到的两两笔画间布局特征向量矩阵F2O×O,添加到相应的总体两两笔画间布局特征集合矩阵中去GF2O×O,从步骤A8)返回的两两笔画间布局特征向量矩阵F2O×O的第1行第1列元素开始,按从左到右,从下到下的顺序,逐个读取F2O×O的第k行第j列元素f2kj,若f2kj≠null,则GF2kj=GF2kj∪{f2kj};否则不用更新该统计量GF2kj;循环结束后,完成对总体两两笔画间布局特征集合GF2kj的更新;
A10)i=i+1,若i≤N,则跳转至步骤A3),否则,则跳转至步骤A11);
A11)人群中关于标准汉字c的单笔画布局特征联合概率密度函数的估计:以总体单笔画布局特征集合GF1k为训练样本,采用统计学习的方法估算人群中关于标准汉字c的被识别为第k段笔画的单笔画布局特征概率密度函数f1k(xg,yg,a,b,Angle,Ux,Uy,P1U,PcU),1≤k≤O;
A12)人群中关于标准汉字c的两两笔画间布局特征联合概率密度函数的估计:对总体两两笔画间布局特征集合矩阵GF2O×O中的每一个元素GF2kj,1≤k≤O,1≤j≤O,按集合中每个向量的两矩阵位置关系类型分量划分成若干个互不相交的子集合子集 表示集合GF2kj中所有两矩阵位置关系类型为u的两两笔画间布局特征向量集合,1≤u≤N1,N1表示两矩阵位置关系类型的类别数,所分得的各子集合 具有以下特性:1) 2)当u≠v时, 统计每一个矩阵位置关系类别出现的频率 其中 表示集合 中元素的个数,
最后,在每一个特征向量子集 上,采用统计学习的方法估算
人群中关于标准汉字c的被识别为第k段和第j段笔画之间矩阵位置关系类型为u的两两笔画布局特征概率密度函数 采用相同的方法,从集合矩阵GF2O×O的第1行第1列元素开始,按从左到右,从上到下的顺序,对矩阵中每一个元素GF2kj做同样的操作,1≤k≤O,1≤j≤O,得到相应的两两笔画布局特征概率密度函数A13)结束:关于标准汉字c的预训练过程结束,返回的数据包括:1)标准汉字c的第k段类型笔画在人群中出现和未出现的频率nk/N和 2)人群书写关于标准汉字c的手写笔迹中两两类型笔画相交和未相交笔迹出现的频率ri×j/n1ij和
3)人群书写的标准汉字c的第k段类型笔画的单笔画布局特征联合
概率密度函数f1k(xg,yg,a,b,Angle,Ux,Uy,P1U,PcU),1≤k≤O;4)预训练手写笔迹样本集合中具有该特性的样本个数 5)人群书写的关于标准汉 字 c的 具 有 该 特 性的 两 两 笔 画 类 型 布 局 特 征 联 合 概 率 密 度 函 数所述具有该特性是指预学习手写笔迹样本中存在笔画被识别为第k和第j段笔画类型,且包含该两段类型笔画的面积最小的两矩形位置关系类型为u。
3.根据权利要求2所述在线笔迹认证中一种笔迹布局特征的提取及认证方法,其特征在于:所述步骤B)中,笔画布局特征注册包括如下步骤:B1)注册开始:用户提交关于标准汉字c的注册手写笔迹样本集合H={h1,h2,...,hp},p≥3
B2)初始化:置循环变量i=1,置标准汉字c的第j段笔画在注册手写笔迹样本集合H中出现的次数计数变量Ej=0,1≤j≤O,置标准汉字c的第j段笔画在注册手写笔迹样本集合H中未出现的次数计数变量 置注册手写笔迹样本集合H的笔画相交统计矩阵和未相交统计矩阵VO×O=0O×O, 其中vij、 分别表示在手写笔迹样本集合H中具有和不具有这种特性的笔迹样本个数,所述特性是指在该笔迹样本中有被识别为标准汉字c的第i和第j段的两段笔画且这两段笔画相交;初始化集合H中被识别为第k段类型的单笔画布局特征集合GF3k为空,k=1,2,...,O,初始化集合H中两两笔画间的布局特征集合矩阵GF4O×O中每一个元素GF4kj为空,1≤k≤O,1≤j≤O,其中矩阵的第k行第j列元素GF4kj表示被识别为第k段和第j段笔画之间的布局特征集合,O表示汉字c标准书写体所包含的基本笔画数;
B3)识别第i个注册样本hi的笔画类型:对注册样本hi按笔画进行分割,得到笔画序列识别hi中每一段笔画的类型,设 表示返回的笔画类型识别结果,其中ok表示注册样本hi中的第k段笔画被识别为标准汉字c的第ok段笔画,1≤ok≤O,ni表示hi中的笔画数,O表示标准汉字c包含的基本笔画数,若第k段笔画出现在注册样本hi中,则计数变量Ek=Ek+1,否则, 变量k从标准汉字c的第1段笔画开始到标准汉字c最后一段笔画结束,一轮循环后,完成注册样本hi对统计量Ek和 的更新;
B4)注册样本hi中两两笔画交叉点计算:以注册样本hi的笔画序列 笔
画类型识别结果 人工标注的标准汉字c中应相交笔画矩阵CO×O作为输入
参数,得到注册样本hi的两两笔画间交叉点矩阵PO×O,和与注册样本hi中被识别为第k段笔画相交的交叉点集合Wk,k=1,2,...,O;若注册样本hi中被识别为第k段和第j段笔画不相交,那么交叉点矩阵PO×O中元素ptkj=0,交叉点集合Wk和Wj中交叉点pkj=(null,null)和pjk=(null,null);否则,交叉点矩阵PO×O中元素ptkj=1,交叉点集合Wk和Wj中交叉点pkj和pjk为叉交点二维坐标,1≤j≤O,1≤k≤O;
B5)笔画相交信息的统计量更新:从B4)返回的两两笔画间交叉点矩阵PO×O的第1行第1列元素开始,按从左到右,从上到下的顺序,逐个读取PO×O的元素,若注册样本hi中存在笔画被识别为第k和第j笔画类型,且ptkj==1和pkj=(null,null),那么 否则,若pkj≠(null,null),表示相应的两段笔画有相交,vkj=vkj+1,双重循环结束后,完成注册样本hi对统计量矩阵VO×O和 的更新;
B6)注册样本hi中单个笔画的布局特征计算:以注册样本hi的笔画序列
笔画类型识别结果 作为输入参数,得到注册样本hi的
被识别为第k段笔画类型的笔画布局特征向量F3k,1≤k≤O;若注册样本hi中存在笔画被识别为第k段笔画类型,则F3k=(xg,yg,a,b,Angle,Ux,Uy,P1U,PcU);否则,F3k=null,1≤k≤O;
B7)单笔画布局特征统计量的更新:将在注册样本hi上得到的各个笔画布局特征向量F3k,k=1,2,...,O添加到相应的关于注册笔迹样本集H的单笔画布局特征集合中去GF3k,从第一段笔画开始到第O段笔画结束,若F3k==null,表示注册样本hi中没有笔画被识别为第k段笔画类型,不用更新,否则,GF3k=GF3k∪{F3k},循环结束后,完成关于注册笔迹样本集H的单笔画布局特征集合GF3k的更新,k=1,2,...,O;
B8)注册样本hi中两两笔画间的布局特征计算:以注册样本hi的笔画序列
笔画类型识别结果 与注册样本hi中被识别为第k段笔
画相交的交叉点集合Wk,k=1,2,...,O,注册样本hi中两两笔画间的交叉点矩阵PO×O为输入参数,得到注册样本hi的两两笔画间布局特征向量矩阵F4O×O;若注册样本hi中存在两段笔画被识别为第k段和第j段笔画类型,则否则,
B9)两两笔画间布局特征统计量的更新:将在注册样本hi上得到的两两笔画间布局特征向量矩阵F4O×O,添加到相应的关于注册笔迹样本集H的两两笔画间布局特征集合矩阵中去GF4O×O,从步骤208返回的两两笔画间布局特征向量矩阵F4O×O的第1行第1列元素开始,按从左到右,从下到下的顺序,逐个读取F4O×O的第k行第j列元素f4kj,若f4kj≠null,则GF4kj=GF4kj∪{f4kj};否则不用更新该统计量GF4kj;循环结束后,完成关于注册笔迹样本集H的两两笔画间布局特征集合GF4O×O的更新;
B10)i=i+1,若i≤p,则跳转至步骤B3),否则,则跳转至步骤B11);
B11)注册笔迹样本集H关于标准汉字c的单笔画布局特征在各个分量上的最大最小值:
对于集合GF3k,GF3k表示以注册笔迹样本集H中由所有被识别为第k段类型笔画的单笔画布局特征构成的集合,计算单笔画布局特征的每一个分量在集合GF3k上的最大最小值,1≤k≤O;如果集合GF3k中元素个数小于2,那么最大最小值集合MF3k=null,否则用表示所求得的每个分量上的最大最小值集合,其中 表示与第k段类型笔画相关的单笔画布局特征向量中第u个分量在注册笔迹样本集H上的最大值, 表示与第k段类型笔画相关的单笔画布局特征向量中第u个分量的最小值,1≤u≤N2,1≤k≤O,N2表示单笔画布局特征向量中分量的个数,此步骤结束后,得到注册笔迹样本集H关于标准汉字c所有笔画的单笔画布局特征在各个分量上的最大最小值集合B12)注册笔迹样本集H关于标准汉字c的两两笔画间布局特征在各个分量上的最大最小值:对注册笔迹样本集H上两两笔画间布局特征集合矩阵GF4O×O中的每一个元素GF4kj,1≤k≤O,1≤j≤O,按集合中每个向量的两矩阵位置关系类型分量划分成若干个互不相交的子集合 子集 表示集合GF4kj中所有两矩阵位置关系类型为u的两两笔画间布局特征向量集合,1≤u≤N1,N1表示两矩阵位置关系类型的类别数,所分得的各子集合 具有以下特性:1) 2)当u≠v时,统计每一个矩阵位置关系类别出现的次数,设 表示集合 中
元素的个数;对于集合 若 那么 否则,计算两两笔画间布局特
征的每一个分量在集合 上的最大最小值,1≤u≤N1,设
表示所求得的每个分量上
的最大最小值集合,其中 表示被识别为第k和第j段类型的两段笔画的布局特征向量中第v个分量在两矩阵位置关系类型为u所有向量上的最大值, 表示被识别为第k和第j 段类型的两段笔画的布局特征向量中第v个分量在两矩阵位置关系类型为u所有向量上的最小值,1≤u≤N1,1≤v≤N4,1≤k≤O,1≤j≤O,N4表示单笔画布局特征向量中分量的个数;
B13)结束:关于标准汉字c的注册过程结束,返回的数据包括:1)第k段笔画在注册笔迹样本集H中出现和未出现的次数Ek和 2)笔画相交点在注册笔迹样本集H中出现和未出现的次数矩阵vkj和 3)注册笔迹样本集H关于标准汉字c所有笔画的单笔画布局特征在各个分量上的最大最小值集合
其中,N2表示单笔画
布局特征向 量中分 量的个数 ;4)具 有特定性 质的 注册笔 迹样本个 数
所述具有特定性质的注册样本是指:a)来自于注册笔
迹样本集H;b)所述注册笔迹样本中包含有被识别为第k和第j段类型两段笔画;c)包含第k和第j段类型两段笔画的矩形之间的位置关系类型为u;5)在具有上述a)b)c)三种性质的注册笔迹样本子集上提取的两两笔迹间布局特征向量,在所述特征向量的每个分量上的最大最小值
4.根据权利要求3所述在线笔迹认证中一种笔迹布局特征的提取及认证方法,其特征在于:所述步骤C)中,笔画布局特征认证包括如下步骤:C1)认证阶段开始:用户输入关于标准汉字c的测试手写笔迹样本W;
C2)初始化:置标准汉字c的第j段笔画在测试手写笔迹样本W中出现的次数计数变量yj=0,1≤j≤O,置标准汉字c的第j段笔画在测试手写笔迹样本W中未出现的次数计数变量置注册手写笔迹样本集合H的笔画相交统计矩阵和未相交统计矩阵ZO×O=0O×O, 其中zij、 分别表示在测试手写笔迹样本W中具有和不具有这种特性的笔迹样本个数,所述特性是指在该笔迹样本中被识别为标准汉字c的第i和第j段的两段笔画之间相交;
C3)识别测试手写笔迹样本W的笔画类型,并更新统计量:对测试手写笔迹样本W按笔画进行分割,得到笔画序列 识别笔迹W中每一段笔画的类型,设表示返回的笔画类型识别结果,其中ok表示测试手写笔迹样本W中的第k
段笔画被识别为标准汉字c的第ok段笔画,1≤ok≤O,nw表示W中的笔画数,O表示标准汉字c包含的基本笔画数,若第k段笔画出现在测试手写笔迹样本W中,则计数变量yk=yk+1,否则,变量k从标准汉字c的第1段笔画开始到标准汉字c最后一段笔画结束,一轮循环后,完成测试手写笔迹样本W对统计量yk和 的更新;
C4)测试手写笔迹样本W中两两笔画交叉点计算:以测试手写笔迹样本W的笔画序列笔画类型识别结果 人工标注的标准汉字c中应相交笔画矩阵CO×O作为输入参数,得到测试手写笔迹样本W的两两笔画间交叉点矩阵QO×O,和与测试手写笔迹样本W中被识别为第k段笔画相交的交叉点集合Xk,k=1,2,...,O;若测试手写笔迹样本W中被识别为第k段和第j段笔画不相交,那么交叉点矩阵QO×O中元素qtkj=0,交叉点集合Xk和Xj中交叉点qkj=(null,null)和qjk=(null,null);否则,交叉点矩阵QO×O中元素qtkj=1,交叉点集合Xk和Xj中交叉点qkj和qjk为叉交点二维坐标,1≤j≤O,1≤k≤O;
C5)笔画交叉信息的统计量更新:从步骤C4)返回的两两笔画间交叉点矩阵QO×O的第1行第1列元素开始,按从左到右,从上到下的顺序,逐个读取QO×O的元素,若qkj=(null,null),表示测试手写笔迹样本W中被识别为第k和第j笔画类型的两段笔画没有相交,那么否则,表示相应的两段笔画有相交,zkj=zkj+1,双重循环结束后,完成测试手写笔迹样本W对统计量矩阵ZO×O和 的更新;
C6)测试手写笔迹样本W中单个笔画的布局特征计算:以测试手写笔迹样本W的笔画序列 笔画类型识别结果 作为输入参数,得到测试手写笔迹样本W的被识别为第k段笔画类型的笔画布局特征向量F5k,1≤k≤O;若测试手写笔迹样本W中存在笔画被识别为第k段笔画类型,则F5k=(xg,yg,a,b,Angle,Ux,Uy,P1U,PcU);否则,F5k=null,1≤k≤O;
C7)测试手写笔迹样本W中两两笔画间的布局特征计算:以测试手写笔迹样本W的笔画序列 笔画类型识别结果 与测试手写笔迹样本W中被识别为第k段笔画相交的交叉点集合Xk,k=1,2,...,O,测试手写笔迹样本W中两两笔画间的交叉点矩阵QO×O作为输入参数,得到测试手写笔迹样本W的两两笔画间布局特征向量矩阵F6O×O;若测试手写笔迹样本W中中存在两段笔画被识别为第k段和第j段笔画类型,则f6kj=(DisTS,DispTS,AngleTS,TD,R,P1U,PcU,PTU);否则,f6kj=null,1≤k≤O,1≤j≤O;
C8)计算观察到测试手写笔迹样本W中各笔画的概率P1:若测试手写笔迹样本W中存在笔画被识别为第k段笔画类型且在注册手写笔迹集合中具有这样的样本至少存在2个,所述具有这样的注册笔迹样本是指注册样本中存在笔画被识别为第k段笔画类型,即yk==1且Ek≥2,那么取预学习阶段获取的该笔画出现的频率作为该笔画的出现概率,即p1k=nk/N,否则,若测试手写笔迹样本W中不存在笔画被识别为第k段笔画类型且在注册手写笔迹集合中具有这样的样本至少存在2个,所述具有这样的注册笔迹样本是指注册样本中不存在笔画被识别为第k段笔画类型,即 且 那么取预学习阶段获取的该笔画出现的频率作为该笔画的出现概率,即 否则,表明第k段笔画类型在注册笔迹样本和注册笔画迹样本中出现方式不一致,置p1k=1;k=1,2,...,O,最后置C9)计算观察到测试样本笔迹W中交叉点的概率P2:若测试手写笔迹样本W中存在笔画被识别为第k段和第j段笔画类型且所述这两段笔画相交,而且在注册手写笔迹集合中具有这样的样本至少存在2个,所述具有这样的注册笔迹样本是指注册样本中存在笔画被识别为第k段和第j段笔画类型且所述这两段笔画相交,即zkj==1且vkj≥2,那么取预学习阶段获取的该笔画出现的频率作为该笔画的出现概率,即p2kj=rkj/n1kj,否则,若测试手写笔迹样本W中存在笔画被识别为第k段和第j段笔画类型且所述这两段笔画不相交,而且在注册手写笔迹集合中具有这样的样本至少存在2个,所述具有这样的注册笔迹样本是指注册样本中存在笔画被识别为第k段和第j段笔画类型且所述这两段笔画不相交,即 且那么取预学习阶段获取的该笔画出现的频率作为该笔画的出现概率,即否则,表明第k段和第j段笔画类型相交在注册笔迹样本和注册笔画迹样本中出现方式不一致,置p2kj=1,1≤k≤O,1≤j≤O,最后置C10)计算观察到测试样本笔迹W中单个笔画布局特征的概率P3:在注册样本集上,若被识别为第k段笔画类型的单笔画布局特征向量MF3k==null或者第k段笔画类型在测试样本W中未出现,则置p3k=1,1≤k≤O,否则,采用下式计算观察到测试手写笔迹中被识别为第k段笔画类型的单笔画布局特征的概率, 其中f1k(·)表示在预训练阶段学习到的关于标准汉字c被识别为第k段笔画的单笔画布局特征概率密度函数,F5k=(xg,yg,a,b,Angle,Ux,Uy,P1U,PcU)表示在测试手写笔迹样本W中提取到的被识别为第k段笔画类型的单笔画布局特征向量,积分区域D=(d1,d2,...,dN2)由如下式所定义, 其中vi表示特征向量F5k中第i个分量取值, 和 分别表示在注册阶段获取的在注册样本集合中所有被识别为第k段类型笔画的单笔画布局特征向量在第i个分量上的最大最小值,N2表示单笔画布局特征向量中分量的个数,变量k从标准汉字c的第1段笔画开始到标准汉字c最后一段笔画结束,一轮循环后,得到观测到所有笔画类型的概率p3k,1≤k≤O,最后,置观察到测试样本笔迹W中所有单个笔画布局特征的概率C11)计算观察到测试样本笔迹W中所有两两笔画间布局特征的概率矩阵PEO×O:以如下4种数据作为输入参数:1)测试手写笔迹样本W中两两笔画间的布局特征矩阵F6O×O,2)注册阶段获取的注册笔迹样本子集个数 3)注册阶段获取的注册笔迹样本集关于笔画间布局特征在每个分量上的最大最小值
4)预训练阶段获取的标准汉字c关于两两笔画布局特征概率密度函
数 得到
观察到测试笔迹中所有两两笔画间布局特征的概率矩阵PEO×O,其中矩阵中第k行第j列元素pejk表示观测到测试笔迹中被识别为第k和第j段类型的两段笔画间布局特征概率,1≤k≤O,1≤k≤O;
C12)计算观察到测试样本笔迹W中两两笔画间布局特征的概率P4:以测试笔迹样本W中的笔画作为结点集V,以概率矩阵PEO×O中的元素作为连接结点的无向边的权值E,得到一个无向带权图G=<V,E>,从图G出发,构造一个关于图G的最小生成树G'=<V,E'>,根据G'得到测试样本笔迹W中两两笔画间布局特征的概率C13)计算观察到测试样本笔迹W的布局特征概率P(W)=P1×P2×P3×P4;
C14)测试笔画与布局特征相关的判别:将布局特征概率P(W),融合笔画的其它特征,包括笔顺、书写用力、书写节奏,综合判断该测试样本笔迹W是否为真实笔迹;
C15)结束:测试笔迹的认证过程结束。
5.根据权利要求4所述在线笔迹认证中一种笔迹布局特征的提取及认证方法,其特征在于:单个笔画的布局特征计算包括如下步骤:D1)开始:设输入参数S={(x1,y1),(x2,y2),...,(xn,yn)}表示笔迹中笔画S的采样点时序数据,(xi,yi)表示笔画S中在第i个采样时刻笔尖的位置数据, 表示笔画S与笔迹中其它笔画的交叉点坐标,其中 表示交叉点二维的x,y坐标,下标si表示与S相交的笔画在笔迹中的序号,1≤i≤ms,ms表示Pc中交叉点的个数,与S相交的笔画是由人工标注的在标准书写体中本应出现相交的笔画,若手写体非标准笔迹中第si段笔画与S没有交叉点,那么用符号null表示,D2)计算笔画重心点G=(xg,yg):其中
D3)寻找包含笔画S的面积最小的矩形V=(p1,p2,p3,p4):其中p1,p2,p3,p4是矩形的四个顶点,pi=(pxi,pyi),1≤i≤4,U=(U1,U2,U3,U4)表示矩形V的四条有向边,其中D4)计算矩形V的四条有向边长度:设|U1|=|U3|=a,|U2|=|U4|=b;
D5)计算笔画S的方位角:比较矩形V两条边的长度,若a>b,置W={U1,U3},若a<b,置W={U2,U4},若a=b,W={U1,U2,U3,U4},设Q表示以笔画S中第一个采样点(x1,y1)为开始点,以最后一个采样点(xn,yn)为结束点的向量,计算向量Q与集合W中每个向量之间的夹角QAngle,
0≤QAngle≤180°,计算集合W中与向量Q之间夹角最小的向量,设Ux为集合W中与向量Q之间夹角最小的向量,计算向量Ux与X轴的夹角,设为Angle,以Angle表示笔画S的方位角,-180°≤Angle≤180°;
D6)选取由矩形V定义的坐标系:以步骤D5)介绍的所述矩形V中有向线段Ux的起点为新坐标系的原点,以所述矩形V中过该原点且相互垂直的两条边为所选坐标系的轴,规定在所述矩形V的两条相互垂直的两条边中,从原点到所述两条边的另一个顶点的方向为正方向,设所选坐标系的两条相互垂直的坐标轴为(Ux,Uy);
D7)计算采样点序列S={(x1,y1),(x2,y2),...,(xn,yn)}在由(Ux,Uy)构成的坐标系下各种极值点:计算序列S中的采样点在新坐标系(Ux,Uy)的x,y方向上极大值、极小值对应的点,设pxM,pxm分别表示x方向上极大和极小值,设pyM,pym分别表示y方向上极大和极小值,由四个极值点和笔画的第一个和最后一个点,得到关于笔画的基本点集合P1={pxM,pxm,pyM,pym,p1,pn},其中p1=(x1,y1),pn=(xn,yn);
D8)计算基本点在新坐标系下的位置坐标:以基本点集合P1和(Ux,Uy)作为输入参数,得到P1在新坐标下的位置坐标集合P1U={p1xM,p1xm,p1yM,p1ym,p11,p1n};
D9)计算交叉点Pc在新坐标系下的位置坐标:以基本点集合Pc和(Ux,Uy)作为输入参数,得到Pc在新坐标下的位置坐标集合PcU={PUs1,PUs2,...,PUsms};
D10)结束:返回笔画S的重心、方位角、矩形边长等布局特征取值(xg,yg,a,b,Angle,Ux,Uy,P1U,PcU)。
6.根据权利要求5所述在线笔迹认证中一种笔迹布局特征的提取及认证方法,其特征在于:两两笔画间的布局特征计算包括如下步骤:E1)开始:两两笔画间的布局特征计算包含的输入参数包括:1)T,S分别表示主笔画和从笔画采样点时间序列,2) 表示从笔画S与笔迹中除主笔画T以外的其它笔画交叉点坐标,其中 表示交叉点二维的x,y坐标,下标si表示与从笔画S相交的笔画在笔画序列中的序号,1≤i≤ms,si不等于主笔画T在笔画序列中的序号,ms表示Pc中交叉点的个数,与S相交的笔画是由人工标注的在标准书写体中本应出现的,若手写体非标准笔迹中第si段笔画与S没有交叉点,那么用符号null表示, 3)主笔画T与从笔画S的交叉点PT={(PTx,PTy)},若在手写笔迹中主笔画T与从笔画S的没有交叉点,PT={(null,null)},4)包含T,S笔画且面积最小的矩形VT=(pt1,pt2,pt3,pt4),VS=(ps1,ps2,ps3,ps4),其中pt1,pt2,pt3,pt4,ps1,ps2,ps3,ps4分别表示矩形VT、VS的四个顶点,5)由矩形VS定义的坐标系(USx,USy),6)由矩形VT定义的坐标系(UTx,UTy),7)笔画S的重心GS=(xsg,ysg),8)笔画T的重心GT=(xtg,ytg);
E2)计算笔画T重心与笔画S重心之间的距离DisTS;
E3)计算笔画T和笔画S的方位角DispTS:定义向量GTS,向量GTS以笔画T的重心GT=(xtg,ytg)作为起点,以笔画S的重心GS=(xsg,ysg)作为终点,计算向量GTS与书写平面X轴之间的夹角DispTS,以夹角DispTS作为笔画S与笔画T的方位角,-180°≤DispTS≤180°;
E4)计算笔画T和笔画S的夹角AngleTS:计算由矩形VT所定义的坐标系(UTx,UTy)和由矩形VS所定义的坐标系(USx,USy)中两个X坐标轴UTx和USx之间的夹角AngleTS,以AngleTS作为笔画S与笔画T的夹角,-180°≤AngleTS≤180°;
E5)计算矩形VT和VS的位置关系类型:以矩形VT和VS的四个顶点为参数,得到VT和VS的位置关系类型TD;
E6)计算矩形VT和VS之间重叠区域的面积R;
E7)计算从笔画采样点序列S={(x1,y1),(x2,y2),...,(xn,yn)}在由(USx,USy)定义的新坐标系下各种极值点:计算从笔画序列S中的采样点在新坐标系(USx,USy)的x,y方向上极大值、极小值对应的点,设pxM,pxm分别表示x方向上极大和极小值,设pyM,pym分别表示y方向上极大和极小值,由四个极值点和从笔画S的第一个和最后一个采样点,得到关于笔画的基本点集合P1={pxM,pxm,pyM,pym,p1,pn},其中p1=(x1,y1),pn=(xn,yn);
E8)计算从笔画S的基本点在主笔画T定义的新坐标系下的位置坐标:以从笔画S的基本点集合P1和主笔画T定义的新坐标系(UTx,UTy)作为输入参数,得到从笔画S的基本点集合P1在主笔画T定义的新坐标下的位置坐标集合P1U={p1xM,p1xm,p1yM,p1ym,p11,p1n};
E9)计算从笔画S的交叉点Pc在主笔画T定义的新坐标系下的位置坐标:以从笔画S的交叉点集合Pc和(UTx,UTy)作为输入参数,得到Pc在主笔画T定义的新坐标下的位置坐标集合所述从笔画S的交叉点是指由人工标注的笔迹中除了主笔画T以外其它所有笔画本应与从笔画S的交叉点,所述本应与从笔画S的交叉点是指依据标准汉字c的表现形式,笔画之间应该出现的交叉点;
E10)计算主笔画T与从笔画S的交叉点PT在主笔画T定义的新坐标系下的位置坐标:以交叉点集合PT和(UTx,UTy)作为输入参数,得到交叉点集合PT在主笔画T定义的新坐标下的位置坐标集合PTU={(PTxU,PTyU)};
E11)结束:返回主笔画T与从笔画S的距离DisTS,主笔画T与从笔画S的方位角DispTS,主笔画T与从笔画S的夹角AngleTS,VT和VS的位置关系类型TD,矩形VT和VS之间重叠区域的面积R,从笔画S的基本点在主笔画T定义的新坐标系(UTx,UTy)下在坐标集合P1U,从笔画S的交叉点在主笔画T定义的新坐标系(UTx,UTy)下在坐标集合PcU,主笔画T与从笔画S的交叉点PT在主笔画T定义的新坐标系下的位置坐标PTU。
7.根据权利要求6所述在线笔迹认证中一种笔迹布局特征的提取及认证方法,其特征在于:人工标注标准汉字两两笔画是否交叉过程包括如下步骤:F1)开始:开始:表示人工标注标准汉字中两两笔画是否相交过程的开始,输入参数为欲人工标注的标准汉字c;
F2)人工标注笔迹中应相交和不应相交的笔画:对于标准汉字c,根据所述标准汉字c的标准表现形式,由人工标注标准汉字c中笔画与笔画之间是否相交叉的信息,得到关于标准汉字c的笔画交叉矩阵;
F3)结束:返回关于标准汉字c的笔画交叉矩阵,标注过程被重复调用执行,得到关于所有标准汉字的笔画交叉矩阵。
8.根据权利要求7所述在线笔迹认证中一种笔迹布局特征的提取及认证方法,其特征在于:两矩形间位置关系类型的计算包括如下步骤:G1)开始:输入参数包括包含T,S笔画且面积最小的矩形VT=(pt1,pt2,pt3,pt4),VS=(ps1,ps2,ps3,ps4),其中pt1,pt2,pt3,pt4,ps1,ps2,ps3,ps4分别表示矩形VT、VS的四个顶点;
G2)对两个矩形的四条边分别进行标记:按x、y方向上的极大极小值,对矩形VT中的四个顶点作如下定义:若x、y方向上的极值唯一,标记pt1为与y极大值对应的顶点,标记pt2为与x极大值对应的顶点,标记pt3为与y极小值对应的顶点,标记pt4为与x极小值对应的顶点,若x、y方向上的极值不唯一,标记pt1为与y极大值和x极小值对应的顶点,标记pt1为与y极大值和x极大值对应的顶点,标记pt3为与y极小值和x极大值对应的顶点,标记pt4为与y极小值和x极小值对应的顶点,进一步,标记矩形VT中的四条边为按同样的方法,标记矩形VS中的四个顶点ps1,ps2,ps3,ps4,然
后,标记矩形VS中的四条边为
G3)计算矩形VT和VS的位置关系类型TD:对于矩形VT的四条边UT={UA,UB,UC,UD}和矩形VS的四条边US={Ua,Ub,Uc,Ud},分别计算UT中的任意一条边与US中的任意一条边是否相交,若相交,则将由相交的两条边组成的二元组添加到相交边集合中,计算矩形边所有两两边之间是否相交后,得到矩形VT和VS之间的边相交集合Dp,最后,依据Dp查询矩阵位置关系类型表得到矩形VT和VS的位置关系类型TD;
所述分属两个矩形的两条边相交是指,若两条边之间没有交点,那么两条边不相交,若两条边之间有交点且所述交点位于其中任意一条边的终点,那么两条边不相交,若两条边之间有交点且所述交点没有位于其中任意一条边的终点,那么两条边相交;
所述矩形边的起点和终点定义如步骤G2)所述;
所述矩阵位置关系类型表是指包含两维信息:1)由所有相交边二元组构成的集合;2)分配给该集合的编号;矩阵位置关系类型表的具体计算过程为:首先收集两个矩形之间所有可能的位置关系,然后,按矩形边是否交相为依据对矩形位置关系进行分类,具有相同相交边二元组集合的两矩形属于同一个位置关系类别,最后,对所有的位置关系类别进行编号,得到矩阵位置关系类型表;在计算阶段,对于待识别位置关系的两矩形,计算所述矩形中由所有相交边二元组构成的集合,依据该集合查表得到两矩形的位置关系类型;
所述相交边二元组的第一个元素表示矩形VT的某一条边,第二个元素表示矩形VS的某一条边,相交边二元组表示分属于矩形VT和VS的这两条边相交;
G4)结束:返回矩形VT和VS的位置关系类型TD。
9.根据权利要求8所述在线笔迹认证中一种笔迹布局特征的提取及认证方法,其特征在于:计算观察到测试笔迹中所有两两笔画间布局特征概率矩阵包括如下步骤:H1)开始:观察到测试笔迹中所有两两笔画间布局特征概率的计算过程的开始,输入参数包括:1)关于标准汉字c的测试手写笔迹样本W中两两笔画间的布局特征矩阵F6O×O,其中fkj=(DisTS,DispTS,AngleTS,TD,R,P1U,PcU,PTU),或者fkj=null,k=1,2,...,O,1≤j≤O,2)关于标准汉字c的注册手写笔迹样本集H中具有特定性质的注册笔迹样本个数其中,O表示标准汉字c包含的基本笔画数,N1表
示两矩阵位置关系类型的类别数,所述具有特定性质的注册样本是指:a)来自于注册笔迹样本集H,b)所述注册笔迹样本中包含有被识别为第k和第j段类型两段笔画,c)包含第k和第j段类型两段笔画的矩形之间的位置关系类型为u,3)在具有上述a)b)c)三种性质的注册笔迹样本子集上提取的两两笔迹间布局特征向量,在所述特征向量的每个分量上的最大最小值 N4表示单笔画布局特征向量中分量的个数,4)标准汉字c关于两两笔画布局特征概率密度函数
H2)初始化:置观察到测试笔迹中所有两两笔画间布局特征的概率矩阵PEO×O=1O×O,其中矩阵中第k行第j列元素pejk表示观测到测试笔迹中被识别为第k和第j段类型的两段笔画间布局特征概率,pejk=1,1≤j≤O,1≤k≤O,初始化循环量m=1;
H3)初始化循环量n=1;
H4)若m==n,则跳转到步骤H10),否则,跳转到到步骤H5);
H5)取出测试笔迹中被识别为第m和第n段类型的两段笔画间布局特征fmn,若fmn==null,则跳转到步骤H10),否则,跳转到到步骤H6);
H6)从fmn中取出表示两矩阵位置关系类型的分量TD,1≤TD≤N1,所述两矩阵是指分别包含测试笔迹中被识别为第m和第n段类型笔画且面积最小的矩形;
H7)取出注册笔迹样本集中具有特定属性的注册笔迹样本子集元素个数变量
所述注册笔迹样本集中具有特定属性的注册笔迹是指:1)所述注册笔迹样本中包含有被识别为第m和第n段类型两段笔画,2)包含第m和第n段类型两段笔画的矩形之间的位置关系类型与测试笔迹的相同,即u=TD;
H8)若 则跳转到步骤H10),否则,跳转到到步骤H9);
H9)计算观测到测试样本中被识别为第m和第n段类型的两段笔画间布局特征概率pemn,采用下式计算观察到测试手写笔迹中被识别为第m和第n段类型两段笔画的两笔画布局特征概率, 其中 N1表示两矩阵位置关系类型的类别数, 表示在预训练阶段学习到的关于标准汉字c被识别为第m和第n段类型两段笔画的两笔画布局特征概率密度函数;fmn=(xg,yg,a,b,Angle,Ux,Uy,P1U,PcU)表示在测试手写笔迹样本W中提取到的被识别为第m和第n段类型的两段笔画布局特征向量,积分区域D由如下式所定义,其中vx表示特征向量fmn中第x个分量取值,N2表示两笔画布局特征向量中分量的个数,和 分别表示在注册阶段获取在具有特定特性注册手写笔迹样本子集上提取的两笔画间布局特征向量在第x个分量上的最大最小值,所述注册笔迹样本集中具有特定属性的注册笔迹是指:1)所述注册笔迹样本中包含有被识别为第m和第n段类型两段笔画,2)包含第m和第n段类型两段笔画的矩形之间的位置关系类型为u;
H10)n=n+1,若n≤O,则跳转至步骤H4),否则,则跳转至步骤H11);
H11)m=m+1,若m≤O,则跳转至步骤H3),否则,则跳转至步骤H12);
H12)结束:观察到测试笔迹中所有两两笔画间布局特征概率的计算过程执行结束,返回结果为观察到测试笔迹中所有两两笔画间布局特征的概率矩阵PEO×O,其中矩阵中第k行第j列元素pejk表示观测到测试笔迹中被识别为第k和第j段类型的两段笔画间布局特征概率,1≤k≤O,1≤k≤O。
10.根据权利要求9所述在线笔迹认证中一种笔迹布局特征的提取及认证方法,其特征在于:计算点在新坐标系下的位置坐标包括如下步骤:I1)开始:开始计算点在新坐标系下的位置坐标,设输入参数为P={(x1,y1),(x2,y2),...,(xn,yn)}为待计算的书写平面上点的集合,n表示集合中点的个数,输入参数(Ux,Uy)为书写平面上相互垂直的向量,以两向量的交点作为新坐标系的原点,以向量Ux作为x轴,以向量Ux的方向为x轴的正方向,以向量Uy作为y轴,以向量Uy的方向为y轴的正方向;
I2)置下标变量i=1,置关键点在新坐标系下的坐标集合P1为空;
I3)取集合P中第i个点(xi,yi),计算点(xi,yi)在坐标系(Ux,Uy)中的坐标,设为PUi=(Pxi,Pyi),将PUi增加到P1集合,PU=PU∪{PUi},特别地,若(xi,yi)=(null,null),那么置PUi=(null,null);
I4)坐标归一化:xi=xi/||Ux||,yi=yi/||Uy||,其中||Ux||表示向量Ux的模,||Uy||表示向量Uy的模;
I5)i=i+1,若下标变量i<=n,跳转到步骤I3),否则,跳转到步骤I6);
I6)结束:返回点集P在新坐标系下的位置坐标PU={PU1,PU2,...,PUn},其中,PUi=(Pxi,Pyi)。