1.显示终端身份识别方法,其特征在于,包括身份码嵌入过程和终端识别过程;
所述身份码嵌入过程,包括如下步骤:S1,获取显示终端中正在使用的字体文件,同时生成唯一标识所述显示终端的身份码;
S2,将字体文件中的常用汉字和身份码序列进行分组;
S3,修改常用汉字笔画结构生成变形汉字,并用生成的变形汉字来承载身份码信息,同时建立变形字集合;
S4,用步骤S3建立的变形字集合中的变形字替换原字体文件中的常用汉字字体,并生成新字体文件;
S5,用新字体文件替换显示终端中的原字体文件,完成终端身份码的嵌入;
所述终端识别过程,包括如下步骤:S6,获取待识别终端来源的文本图片;
S7,对所述文本图片进行文字识别和切分处理,获取每一个汉字和对应的汉字图像块;
S8,将汉字图像块与变形字集合进行匹配,并提取匹配的变形字所承载的身份码比特信息;
S9,利用常用汉字分组对步骤S8所提取的身份码比特信息进行排列,并采用投票算法纠错,同时提取出正确的身份码序列;
S10,将提取出的身份码序列转换回终端标识信息,识别出信息所标识的显示终端;
步骤S1包括如下步骤:
S11,获取显示终端中正在使用的字体文件,作为身份码信息嵌入的载体;
S12,生成代表所述显示终端唯一身份标识的K位二进制比特序列,所述K位二进制比特序列作为显示终端的身份码;
其中,二进制比特序列由显示终端的MAC地址、IP地址、主机名、用户名和当前时间信息组合生成;
步骤S2包括如下步骤:
S21,将K位的二进制比特序列按照每2位一组共划分为k=K/2组;
S22,将字体文件中的n个常用汉字划分为k组;
其中,常用汉字分组规则为:将待分组汉字按照使用频率由高到低进行排序;若汉字排在第i位,则划分到第i%k组,%表示取余符号;
步骤S3包括如下步骤:
S31,对k个分组中的n个常用汉字,依次使用字体制作工具修改每个汉字的笔画结构,生成4种不同的变形汉字;
S32,将每个汉字的4种不同变形汉字的字符,采用二进制依次编号为00、01、10、11,用于承载2位比特的身份码信息;
S33,将步骤S2得到的k组二进制比特序列与k组常用汉字一一对应,依次根据每一组的二进制比特序列信息,对每一个常用汉字选择4种变形汉字字符中的一种,建立常用汉字的变形字集合;
步骤S4包括如下步骤:
S41,在步骤S1获取的字体文件中,将n个常用汉字替换为步骤S3得到的变形字集合中的变形字体,生成新字体文件;
其中,新字体文件中的非常用汉字保持不变;
步骤S8包括如下步骤:
S81,对于每一个汉字图像块,依次判断汉字是否为常用汉字;
S82,如若汉字为非常用汉字,则不做处理;若汉字为常用汉字,则将汉字图像块与对应汉字的4种不同变形汉字的字符分别进行匹配,根据匹配结果,判断出汉字属于的变形汉字字符,并获取对应变形汉字字符所承载的2位比特信息;
步骤S9包括如下步骤:
S91,利用步骤S2的常用汉字分组,依次将步骤S82得到的2位比特信息与分组中的常用汉字一一对应,生成k组不同的比特信息;
S92,依次选择每一组中出现次数最多的比特信息,作为对应组提取正确的2位比特信息;
S93,依次输出k组的2位比特信息,获得K=2×k位的二进制身份码序列。
2.根据权利要求1所述的显示终端身份识别方法,其特征在于,步骤S10包括如下步骤:将步骤S93获得的二进制身份码序列转换为显示终端的MAC地址、IP地址、主机名、用户名和时间标识信息,识别出身份码信息所标识的显示终端,完成终端识别过程。
3.显示终端身份识别系统,应用权利要求1‑2中任一项所述的显示终端身份识别方法,其特征在于,所述显示终端身份识别系统包括:字体信息获取模块,用于获取显示终端中正在使用的字体文件,同时生成唯一标识所述显示终端的身份码,并将字体文件中的常用汉字和身份码序列进行分组;
字体处理模块,用于修改常用汉字笔画结构生成变形汉字,并用生成的变形汉字来承载身份码信息,同时建立变形字集合;
文件替换模块,用于将变形字集合中的变形字替换原字体文件中的常用汉字字体,并生成新字体文件,并用新字体文件替换显示终端中的原字体文件;
文本图片获取模块,用于获取待识别终端来源的文本图片;
文本图片处理模块,用于对文本图片进行文字识别和切分处理,获取每一个汉字和对应的汉字图像块;
匹配提取模块,用于将汉字图像块与变形字集合进行匹配,并提取匹配的变形字所承载的身份码比特信息,并利用常用汉字分组对提取的身份码比特信息进行排列,并采用投票算法纠错,同时提取出正确的身份码序列;
识别模块,用于将提取出的身份码序列转换回终端标识信息,识别出信息所标识的显示终端。
4.计算机可读存储介质,其特征在于,包括计算机可执行指令,当所述计算机可执行指令被一个或多个处理器执行时,使得所述处理器执行权利要求1‑2中任一项所述的显示终端身份识别方法的步骤。