欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2022112195927
申请人: 江西师范大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2023-12-11
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于笔画和部首分解的零样本汉字识别方法,其特征在于:包括下列步骤:步骤一、建立包含笔画模块和部首模块的训练模型,通过训练模型能获得笔画特征、部首特征、笔画编码和部首编码;

步骤二、将样本图片输入训练模型进行训练;

步骤三、将待识别图片放入已经训练好的模型中,得到模型预测出的笔画编码和笔画特征后对预测的编码做出判断,判断结果存在唯一对应的汉字时将该汉字作为最终输出结果;否则经笔画修订后,通过将该笔画编码对应的多个汉字的支持样本与之前获得的笔画特征进行笔画特征的匹配确定最终输出结果。

2.根据权利要求1所述的一种基于笔画和部首分解的零样本汉字识别方法,其特征在于:所述步骤二具体包括:所述笔画模块和所述部首模块均由编码器和解码器构成,输入图片后训练模型一方面将输入的图片放入笔画模块的笔画编码器中得到笔画特征Fs,再将笔画特征Fs放入笔画模块的笔画解码器中进行解码得到预测的笔画编码Ps;另一方面对于部首模块,将输入的图片放入部首模块的部首编码器中得到部首特征Fr,再将部首特征Fr放入部首模块的部首解码器中进行解码得到预测的部首编码Pr;训练中对笔画特征Fs和部首特征Fr进行了余弦距离的损失计算,对预测的笔画编码Ps和部首编码Pr分别与他们对应的真实标签进行了交叉熵的损失计算,通过余弦距离损失和交叉熵损失对模型进行优化。

3.根据权利要求2所述的一种基于笔画和部首分解的零样本汉字识别方法,其特征在于:采用余弦距离损失对模型进行优化的公式如下:其中,T表示笔画特征Fs的转置,*和×均表示点乘;

本模型中,根据笔画编码Ps的真实标签 和部首编码Pr的真实标签

Gst和Grt中的t均表示时间步长t处,T0是编码标签长度即编码中t的最大值,因此相应交叉熵损失对模型进行优化的公式分别为:

T0是编码标签长度,p(Gst)是指时间步长t处类别Gst的概率,p(Grt)是指时间步长t处类别Grt的概率。

4.根据权利要求1所述的一种基于笔画和部首分解的零样本汉字识别方法,其特征在于:所述步骤三具体包括:通过将待识别图片放入已经训练好的模型中,得到模型预测出的t t t笔画编码Ps和笔画特征Fs ,之后对预测的编码做出判断,判断的依据以笔画编码Ps为主。

首先对笔画编码进行编码是否唯一以及编码对应的汉字是否唯一的判断,若均满足则直接t t输出该编码对应的唯一汉字Ps (char);否则对笔画编码Ps进行修订, 为修订后的笔画编码,将 对应多个汉字的支持样本图片 输入到上述训练后模型的笔画编码器得到对应t的笔画特征 笔画特征 与待识别汉字的笔画特征Fs 进行字符层面的相似度度量,选择相似度最高的特征图所对应的汉字作为最终输出的结果。

5.根据权利要求4所述的一种基于笔画和部首分解的零样本汉字识别方法,其特征在t于:所述步骤三中,笔画编码Ps的修订公式如下:

t

其中 为修订后的笔画编码,N(Ps)表示笔画编码的候选集合,Ds为笔画字典。

6.根据权利要求3所述的一种基于笔画和部首分解的零样本汉字识别方法,其特征在于:所述编码器均包括2个卷积层,1个最大池化层和16个残差模块;解码器使用的是transformer的原始解码器,主要由三个部分组成,包括掩蔽式多头注意模块、多头注意模块和前馈模块。