欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2018104309898
申请人: 北京第一因科技有限公司
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-02-23
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种文字识别纠错方法,其特征在于,所述文字识别纠错方法包括以下步骤:当接收到待纠错文件时,读取待纠错文件的扩展名,并根据所述扩展名确定待纠错文件的属性;

判断待纠错文件的属性是否为只读文件,若待纠错文件的属性是只读文件,对待纠错文件进行属性转换,生成可编辑文件;

读取可编辑文件中的多个关键词,形成关键词组,并根据关键词组确定可编辑文件的目标文件类型;

根据各可编辑文件类型与纠错库的预设映射关系,确定与目标文件类型对应的目标纠错库,并调用所述目标纠错库对可编辑文件纠错;

所述对待纠错文件进行属性转换,生成可编辑文件的步骤包括:对待纠错文件进行扫描,根据待纠错文件中各文字之间的大小关系以及间隔关系确定待纠错文件中的标题和段落;

逐一扫描标题和段落中的文字,根据预设文字库对所扫描的文字进行识别,并对识别的标题文字添加标题标识符;

将所识别的标题文字和段落文字传输到预设编辑器中,生成可编辑文件;

所述读取可编辑文件中的多个关键词,形成关键词组的步骤包括:读取可编辑文件中的词组,并统计各词组所出现的频次,将频次大于预设值的词组作为关键词;

根据标题标识符获取标题中的词组,将标题中的词组与关键词一并形成关键词组,其中,文件中的标题内容或者标题类型反映文件类型。

2.如权利要求1所述的文字识别纠错方法,其特征在于,调用目标纠错库对可编辑文件纠错的步骤包括:识别可编辑文件中的语句,并检测各语句中的连接词,按照连接词将语句划分为多个待识别词组;

逐一将待识别词组与目标纠错库中各预设词组对比,判断目标纠错库中是否存在与待识别词组一致的预设词组;

若目标纠错库中不存在与待识别词组一致的预设词组,获取目标纠错库中与待识别词组相似度最高的目标预设词组,并用所述目标预设词组替换待识别词组。

3.如权利要求2所述的文字识别纠错方法,其特征在于,所述用所述目标预设词组替换待识别词组的步骤包括:获取与当前待识别词组相邻的待识别词组,并将相邻的待识别词组与目标预设词组形成待识别语句,根据待识别语句判断目标预设词组与可编辑文件的语义情景匹配性;

若目标预设词组与可编辑文件匹配,则用目标预设词组替换待识别词组。

4.如权利要求1所述的文字识别纠错方法,其特征在于,所述根据关键词组确定可编辑文件的目标文件类型的步骤包括:将关键词组和预设关键词组库对比,确定预设关键词组库中的目标关键词组,其中目标关键词组与关键词组的元素匹配率最高;

根据预设关键词组库中关键词组与文件类型的映射关系,确定与目标关键词组对应的目标文件类型,将所述对应的目标文件类型确定为可编辑文件的目标文件类型。

5.如权利要求1‑4任一项所述的文字识别纠错方法,其特征在于,所述调用所述目标纠错库对可编辑文件纠错的步骤之后包括:将经纠错的可编辑文件输出,并在接收到对输出的可编辑文件的修正操作时,将与修正操作对应的修正词传输到目标纠错库中,以对目标纠错库更新。

6.一种文字识别纠错装置,其特征在于,所述文字识别纠错装置包括:读取模块,用于当接收到待纠错文件时,读取待纠错文件的扩展名,并根据所述扩展名确定待纠错文件的属性;

判断模块,用于判断待纠错文件的属性是否为只读文件,若待纠错文件的属性是只读文件,对待纠错文件进行属性转换,生成可编辑文件;

确定模块,用于读取可编辑文件中的多个关键词,形成关键词组,并根据关键词组确定可编辑文件的目标文件类型;

纠错模块,用于根据各可编辑文件类型与纠错库的预设映射关系,确定与目标文件类型对应的目标纠错库,并调用所述目标纠错库对可编辑文件纠错;

所述判断模块用于实现:对待纠错文件进行扫描,根据待纠错文件中各文字之间的大小关系以及间隔关系确定待纠错文件中的标题和段落;逐一扫描标题和段落中的文字,根据预设文字库对所扫描的文字进行识别,并对识别的标题文字添加标题标识符;将所识别的标题文字和段落文字传输到预设编辑器中,生成可编辑文件;

所述判断模块还用于实现:读取可编辑文件中的词组,并统计各词组所出现的频次,将频次大于预设值的词组作为关键词;根据标题标识符获取标题中的词组,将标题中的词组与关键词一并形成关键词组,其中,文件中的标题内容或者标题类型反映文件类型。

7.一种文字识别纠错设备,其特征在于,所述文字识别纠错设备包括:存储器、处理器、通信总线以及存储在所述存储器上的文字识别纠错程序;

所述通信总线用于实现处理器和存储器之间的连接通信;

所述处理器用于执行所述文字识别纠错程序,以实现如权利要求1‑5中任一项所述的文字识别纠错方法的步骤。

8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有文字识别纠错程序,所述文字识别纠错程序被处理器执行时实现如权利要求1‑5中任一项所述的文字识别纠错方法的步骤。