1.一种基于特征稳定性和特殊性分析的在线笔迹认证方法,其特征在于:包括如下步骤:
步骤100)笔迹特征预学习:收集人群关于标准汉字库中各种标准汉字的大量手写笔迹样本,对具有相同书写内容、各种个性化书写方式以及表现形式的手写笔迹样本集合,事先分析出各种笔迹特征在人群中的统计分布特征,对于其中的离散型笔迹特征,获得特征值分布律,对于其中的连续型笔迹特征,获得联合概率密度函数;所述标准汉字是目前已被广泛使用的具有标准书写样式和表现形式的汉字;
步骤200)笔迹注册:随机挑选若干个标准汉字,针对每一个所挑选的标准汉字,要求注册用户书写并提交与之相对应的若干个注册手写笔迹样本,在每一组具有相同书写内容的注册手写笔迹样本上,提取所述注册手写笔迹样本的特征,对于其中的离散型笔迹特征,统计具有相同取值的特征在注册手写笔迹样本上出现的次数,对于其中的连续型笔迹特征,统计特征取值在注册手写笔迹样本上的最大最小值;针对具有相同书写内容的同一组注册手写笔迹样本,基于在所述步骤100)笔迹特征预学习中取得的离散型笔迹特征值分布律和连续型笔迹特征联合概率密度函数,计算上述笔迹特征观测概率,若所述概率小于预先设定的阈值,则具有此书写内容的该组注册手写笔迹样本注册成功,否则,说明在该组注册手写笔迹样本上进行同一性判别风险较大,注册失败;若注册成功的注册手写笔迹样本组数目超过预先设定的阈值,该用户注册成功;否则,再次从标准汉字库中挑选汉字,重复所述步骤200),直到注册成功的注册手写笔迹样本组数目超过预先设定的阈值为止;
步骤300)笔迹认证:从注册用户成功注册的标准汉字中随机挑选若干个,基于在所述步骤100)笔迹特征预学习中取得的离散型笔迹特征值分布律和连续型笔迹特征联合概率密度函数,计算笔迹特征观测概率,若所述概率大于预先设定的阈值,则增加标准汉字的挑选数量并重新再挑选一组直到计算所得的概率小于预先设定的阈值为止;针对每一个所挑选的标准汉字,要求待认证用户书写并提交与之相对应的一个测试手写笔迹样本,在每个测试手写笔迹样本中搜索与相对应的注册手写笔迹样本稳定且一致的特征,计算观测到所有测试手写笔迹样本中稳定且一致的特征在人群中出现的概率,并依此给出判别;
所述手写笔迹是指通过数据传感设备实时采集书写过程中笔尖运动产生的信息所获得的与时间相关的时序信号序列,所述数据传感设备在每个采样时刻采集的数据包括笔尖的二维位置信息、笔尖施加在书定平面上的压力、笔杆与书写平面的转动角及夹角信息;
所述具有相同书写内容的手写笔迹样本是指相关的若干手写笔迹所能被辩识的标准汉字内容是唯一且相同的;所谓辩识是指建立手写体笔迹与标准汉字之间的对应关系;
所述注册手写笔迹样本是指在注册阶段注册用户书写并提交的用户身份已知的手写笔迹,所述用户身份已知是指手写笔迹书写者的身份是已知的;
所述稳定且一致的特征包含稳定且一致的离散型笔迹特征和稳定且一致的连续型笔迹特征;
所述稳定且一致的离散型笔迹特征是指在测试手写笔迹样本中提取的离散型笔迹特征取值与在注册手写笔迹样本的集合中提取的稳定的离散型笔迹特征取值相同的特征,所述稳定的离散型笔迹特征是指具有相同离散型笔迹特征取值在注册手写笔迹样本的集合上出现次数大于一定阈值的特征;
所述稳定且一致的连续型笔迹特征是指在测试手写笔迹样本中提取的连续型笔迹特征取值处于在注册手写笔迹样本的集合上提取的稳定的连续型笔迹特征取值的最大和最小值之间的特征,所述稳定的连续型笔迹特征是指在注册手写笔迹样本的集合上提取的连续型笔迹特征取值的最大和最小值之间的距离小于一定阈值的特征;
所述测试手写笔迹样本是指在认证阶段待认证用户书写并提交的用户身份未知且有待确认的手写笔迹;所述用户身份未知是指还未确认书写手写笔迹的用户身份与注册手写笔迹样本的用户身份是否相一致,有待进一步确认;所述待认证用户是指真实身份未得到确认的用户。
2.根据权利要求1所述基于特征稳定性和特殊性分析的在线笔迹认证方法,其特征在于:所述步骤100)中,笔迹特征预学习包括如下步骤:步骤110)设C表示系统关注的标准汉字集合,C1表示已预学习标准汉字集合,C2表示未预学习标准汉字集合,其中C1∪C2=C, 所述系统关注的标准汉字集合是指从古至今产生的所有标准、可辨识的汉字中挑选的标准汉字构成的集合,初始化 C2=C;
步骤120)从集合C2中任意挑选一个标准汉字c,C1=C1∪{c},C2=C2-{c},邀请足够多用户书写关于标准汉字c的手写笔迹,设Sc={s1,s2,...,sN}表示足够多的用户手写的关于标准汉字c的手写笔迹样本集合,每位用户提供了1至3个样本,所述足够多的用户是指集合Sc中的手写笔迹样本所包含的特征具有广泛的代表性,涵盖了手写标准汉字c各种书写特征的所有变化可能,N表示集合Sc中的笔迹个数,所述标准汉字c是目前已被广泛使用的具有标准书写样式和表现形式的汉字;
步骤130)提取集合Sc中各种离散型笔迹特征,并计算各种离散型笔迹特征的分布律;
步骤140)提取集合Sc中各种连续型笔迹特征,并计算各种连续型笔迹特征的联合概率密度函数;
步骤150)若集合C1中的标准汉字个数超过预先设定的阈值,则跳转至步骤120)继续挑选下一个标准汉字,否则跳转至步骤160);
步骤160)结束,返回已预学习标准汉字集合C1,以及与集合C1中每一个所挑选标准汉字的手写笔迹样本集合的分布律和联合概率密度函数。
3.根据权利要求2所述基于特征稳定性和特殊性分析的在线笔迹认证方法,其特征在于:所述步骤200)中,笔迹注册包括如下步骤:步骤210)设C表示系统关注的标准汉字集合,C1表示已预学习标准汉字集合,C3表示已注册标准汉字集合,C4表示未注册标准汉字集合,其中C3∪C4=C1, Acc2表示用户成功注册的标准汉字个数,H表示用户提交的与集合C3中已注册标准汉字对应的注册手写笔迹样本集合,初始化 C4=C1, Acc2=0;
步骤220)设置下标变量i=1,设置注册成功的注册笔迹个数变量Acc1=0;
步骤230)从C4随机挑选一个标准汉字,设为ci,要求注册用户书写与ci对应的若干个注册手写笔迹样本,设 表示注册用户在注册阶段书写的与标准汉字ci对应的qi个注册手写笔迹样本的集合,qi≥3;
步骤240)设置下标变量j=1;
步骤250)设注册手写笔迹样本的集合 中第j个注册手写笔迹样本 为测试笔迹,以集合 中其余注册手写笔迹样本为模板笔迹集合 及与步骤100)取得的离散型笔迹特征值分布律和连续型笔迹特征联合概率密度函数,计算得到概率P;
步骤260)若P小于预先设定的阈值T1,则Acc1=Acc1+1;
步骤270)j=j+1,若j大于qi,则跳转至步骤280),否则跳转至步骤250);
步骤280)若Acc1大于预先设定的阈值T2,则判定关于标准汉字ci的笔迹注册成功,跳转至步骤290);否则,跳转至步骤2B0);
步骤290)Acc2=Acc2+1,C3=C3+{ci},C4=C4-{ci},
步骤2A0)若Acc2大于预先设定的阈值T3,则跳转至步骤2C0),否则,跳转至步骤2B0);
步骤2B0)i=i+1,跳转至步骤230);
步骤2C0)返回已注册标准汉字集合C3,用户提交的与集合C3中标准汉字相关的注册手写笔迹样本的集合H,用户成功注册的标准汉字个数Acc2,结束。
4.根据权利要求3所述基于特征稳定性和特殊性分析的在线笔迹认证方法,其特征在于:所述步骤300)中,笔迹认证包括如下步骤:步骤310)开始;
步骤320)从已注册标准汉字集合C3中随机挑选若干个标准汉字呈现给待认证用户,设表示从C3中随机挑选若干个标准汉字集合;
步骤330)从注册手写笔迹样本的集合H中取出与已注册标准汉字集合C5对应的注册手写笔迹样本的集合步骤340)计算在人群中观测到与所有所挑选标准汉字相对应的注册手写笔迹的概率,具体地,计算 其中 表示与所挑选标准汉字 对应的注册手写笔迹样本的集合 中第o个注册手写笔迹的观测概率,1≤o≤qi,qi表示集合 中注册手写笔迹样本的个数,l表示所挑选的标准汉字个数;
所述观测概率 的计算方法为:以注册手写笔迹样本的集合 中第o个注册手写笔迹样本为测试笔迹,以集合 中其余注册手写笔迹样本为模板笔迹集合,以于步骤100)取得的与标准汉字 相对应的离散型笔迹特征值分布律和连续型笔迹特征联合概率密度函数作为输入参数,计算得到概率步骤350)若Px大于预先设定的阈值T4,表明所挑选注册手写笔迹样本在人群中出现的概率较大,重新挑选另一组,跳转至步骤320),否则,跳转到步骤360);
步骤360)待认证用户书写并提交与C5对应的测试手写笔迹样本,设
表示待认证用户书写的与C5中标准汉字一一对应的测试手写笔迹样
本的集合
步骤370)置循环变量i=1;
步骤380)从测试手写笔迹样本的集合W中提取第i个与标准汉字 对应的测试手写笔迹样本 为测试笔迹A,以从注册手写笔迹样本的集合H中取出与标准汉字 对应的注册手写笔迹样本的集合 作为模板笔迹集合B,以及标准汉字 作为参数,通过步骤100)取得的离散型笔迹特征值分布律和连续型笔迹特征联合概率密度函数,计算得到概率Pi;
步骤390)i=i+1,若i≤l,则跳转至步骤340),否则跳转至步骤360);
步骤3A0) 若P小于预先设定的阈值,则判别测试手写笔迹样本的集合W和注册手写笔迹样本的集合H1出自同一书写人,否则判别测试手写笔迹样本的集合W和注册手写笔迹样本的集合H1不出自同一书写人;
步骤3B0)返回判别结果,结束。
5.根据权利要求4所述基于特征稳定性和特殊性分析的在线笔迹认证方法,其特征在于:
所述步骤100)、步骤200)和步骤300)中,计算笔迹特征观测概率包括如下步骤:步骤A)开始;具体地,计算笔迹特征观测概率的输入参数包括:输入参数A表示测试手写笔迹样本,输入参数B={b1,b2,...,by}表示模板手写笔迹样本集合,y表示集合B中模板手写笔迹的个数,y≥2,输入参数c表示与测试手写笔迹样本A、模板手写笔迹样本集合B对应的标准汉字,以及与标准汉字c对应的离散型笔迹特征值分布律和连续型笔迹特征联合概率密度函数;
步骤B)计算测试手写笔迹样本A中稳定且一致的离散型笔迹特征的概率,设D1={d11,d12,...,d1u1}表示从标准汉字c笔迹中提取的相互独立的离散型笔迹特征,提取模板手写笔迹样本集合B的所有模板手写笔迹样本中关于集合D1定义的离散型笔迹特征出现和未出现的次数,设 表示特征d1i在集合B的所有模板手写笔迹样本中出现的次数, 表示特征d1i在集合B的所有模板手写笔迹样本中未出现的次数, 提取在测试手写笔迹样本A中关于集合D1定义的离散型笔迹特征出现和未出现的次数,设 表示特征d1i在测试手写笔迹样本A中出现的次数, 表示特征d1i在测试手写笔迹样本A中未出现的次数, 若 进一步判断是否 若成立,置 否则置若 进一步判断是否 若成立,置 否则置 其中
分别表示在笔迹特征预学习阶段学习到的集合D1中的特征 在集合Sc中出现和未出现的概率,1≤i≤u1,最后计算观测到测试手写笔迹样本的集合W中关于集合D1中各个特征出现和未出现的的概率 所述稳定离散型笔迹特征是指在注册手写笔迹样本集合中包含该离散型笔迹特征取值的注册手写笔迹样本个数大于事先设定阈值的特征,所述一致离散型笔迹特征是指离散型笔迹特征在测试手写笔迹样本上的取值和在注册手写笔迹样本集合上稳定特征的取值相同的特征;
步骤C)计算测试手写笔迹样本A中稳定且一致连续型笔迹特征的联合观测概率,设D2={d21,d22,...,d2u2}表示可从标准汉字c笔迹中提取的连续型笔迹特征集合,设表示从集合B中的每个模板手写笔迹样本上提取的与D2相关的特征向量集合, 表示在测
试手写笔迹样本A上提取的与D2相关的特征向量,设
表示在集合FB中每个分量上的最大最小值,
采用下式计算观测到测试手写笔迹样本A中稳定且一致连续型笔迹特征
的概率, 积分区域G=(g1,g2,...,
gu2)由下式所定义, 其
中 表示在笔迹特征预学习阶段学习到的关于标准汉字c的与特征集合
D2相关的连续型笔迹特征向量联合概率密度函数,所述稳定连续型笔迹特征是指在注册手写笔迹样本集合中该连续型笔迹特征的取值满足Max-Min≤T的特征,其中,Max,Min分别表示该连续型笔迹特征在注册手写笔迹样本集合上取值的最大最小值,T表示事先设定的阈值,所述一致连续型笔迹特征是指连续型笔迹特征在测试手写笔迹样本A上的取值满足Min≤f≤Max的特征,其中,f表示该连续型笔迹特征在测试手写笔迹样本A上的取值;
D)计算P=PD1×PD2(FA),P表示在人群中观测到用户的模板手写笔迹且判别测试手写笔迹样本A和模板手写笔迹样本集合B出自同一书写人的概率,0≤P≤1;
E)返回概率P,结束。