欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2019106006470
申请人: 深圳同奈信息科技有限公司
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-02-23
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于深度学习的表格生成方法,其特征在于,包括:

获取待处理的报告文档;

提取出所述报告文档内包括的所有表格;

通过预设的排序模型从所有所述表格中提取出指定表格,其中所述指定表格为与预设指标相关的表格;

通过预设的识别模型,根据所述指定表格获取指定数据,其中所述指定数据为与所述预设指标相关的数据;

将所述指定数据添加至预设的表格模板中,形成与所述报告文档对应的参照表格;

通过预设的所述识别模型,根据所述指定表格获取指定数据的步骤,包括:获取所有所述指定表格内的表格数据,并对所述表格数据进行结构化存储,其中,所述结构化存储的形式为:属性与属性对应数据值的键值格式,所述属性包括行表头与列表头,所述属性对应数据值为所述行表头与列表头共同对应的数据值;

将所有所述表格数据输入至所述识别模型;

通过所述识别模型从所有所述表格数据中筛选出与所述预设指标存在映射关系的指定列表头,其中所述指定列表头包含于所有所述表格数据内的列表头;

从所有所述预设指标中提取出与所述指定列表头对应的指定指标;

使用所述指定指标替换所述指定列表头,得到替换后的表格数据,并将所述替换后的表格数据确定为所述指定数据;

通过所述识别模型从所有所述表格数据中筛选出与所述预设指标存在映射关系的指定列表头的步骤,包括:通过所述识别模型分别计算各所述表格数据中的第一列表头,与所有所述预设指标中的每个预设指标的编辑距离,其中所述第一列表头包含于所述表格数据内的所有列表头;

根据各所述编辑距离,按照预设的相似度公式分别计算所述第一列表头与每个所述预设指标的相似度;

获取相似度最大的第一预设指标对应的第一相似度;

判断所述第一相似度是否大于预设的相似度阈值;

若所述第一相似度大于预设的相似度阈值,则将所述第一列表头确定为所述指定列表头。

2.根据权利要求1所述的基于深度学习的表格生成方法,其特征在于,所述通过预设的排序模型从所有所述表格中提取出指定表格的步骤,包括:从所有所述表格中分别提取出各所述表格对应的参考信息;

将各所述参考信息分别输入至所述排序模型;

根据各所述参考信息,通过所述排序模型分别计算各所述表格相对于所述预设指标的相关性得分;

筛选所述相关性得分大于预设的相关性得分阈值的所述指定表格,其中所述指定表格包含于所述报告文档内包括的所有表格。

3.根据权利要求2所述的基于深度学习的表格生成方法,其特征在于,所述根据各所述参考信息,通过所述排序模型分别计算各所述表格相对于所述预设指标的相关性得分的步骤,包括:通过所述排序模型对第一参考信息进行分词处理,得到所述第一参考信息对应的各分词,其中所述第一参考信息包含于所有所述表格对应的所有参考信息;

从预设的分词文本库中获取与各所述分词分别对应的参数值;

根据各所述参数值,通过预设的相关性得分计算公式计算所述第一参考信息对应表格的相关性得分。

4.根据权利要求1所述的基于深度学习的表格生成方法,其特征在于,所述将所述指定数据添加至预设的表格模板中,形成与所述报告文档对应的参照表格的步骤之后,包括:从所述参照表格内查找出与待审核表格内的第一数据值对应的第一指定数据值,其中所述第一数据值包含人工填报表格内的所有数据值,所述数据值为待审核表格内的行表头与列表头共同对应的数据值;

判断所述第一数据值与所述第一指定数据值是否相同;

若所述第一数据值与所述第一指定数据值相同,则判断所述第一指定数据值的识别得分是否大于预设的识别得分阈值,其中所述识别得分为同一指定数据对应的表格相关性得分与对应的列表头相似度的乘积;

若所述第一指定数据值的识别得分大于预设的识别得分阈值,则判定对所述第一数据值的审核通过,并为所述第一数据值添加第一标记,其中所述第一标记表示可靠性级别。

5.根据权利要求4所述的基于深度学习的表格生成方法,其特征在于,所述若所述第一数据值与所述第一指定数据值相同,则判断所述第一指定数据值的识别得分是否大于预设的识别得分阈值的步骤之后,包括:若所述第一指定数据值的识别得分不大于预设的识别得分阈值,则判定对所述第一数据值的审核待通过,并为所述第一数据值添加第二标记,其中所述第二标记的可靠性级别低于所述第一标记;

发出对所述第一数据值进行人工审核的提醒信息。

6.一种基于深度学习的表格生成装置,其特征在于,包括:第一获取模块,用于获取待处理的报告文档;

第一提取模块,用于提取出所述报告文档内包含的所有表格;

第二提取模块,用于通过预设的排序模型从所有所述表格中提取出指定表格,其中所述指定表格为与预设指标相关的表格;

第二获取模块,用于通过预设的识别模型,根据所述指定表格获取指定数据,其中所述指定数据为与所述预设指标相关的数据;

添加模块,用于将所述指定数据添加至预设的表格模板中,形成与所述报告文档对应的参照表格;

通过预设的所述识别模型,根据所述指定表格获取指定数据的步骤,包括:获取所有所述指定表格内的表格数据,并对所述表格数据进行结构化存储,其中,所述结构化存储的形式为:属性与属性对应数据值的键值格式,所述属性包括行表头与列表头,所述属性对应数据值为所述行表头与列表头共同对应的数据值;

将所有所述表格数据输入至所述识别模型;

通过所述识别模型从所有所述表格数据中筛选出与所述预设指标存在映射关系的指定列表头,其中所述指定列表头包含于所有所述表格数据内的列表头;

从所有所述预设指标中提取出与所述指定列表头对应的指定指标;

使用所述指定指标替换所述指定列表头,得到替换后的表格数据,并将所述替换后的表格数据确定为所述指定数据;

通过所述识别模型从所有所述表格数据中筛选出与所述预设指标存在映射关系的指定列表头的步骤,包括:通过所述识别模型分别计算各所述表格数据中的第一列表头,与所有所述预设指标中的每个预设指标的编辑距离,其中所述第一列表头包含于所述表格数据内的所有列表头;

根据各所述编辑距离,按照预设的相似度公式分别计算所述第一列表头与每个所述预设指标的相似度;

获取相似度最大的第一预设指标对应的第一相似度;

判断所述第一相似度是否大于预设的相似度阈值;

若所述第一相似度大于预设的相似度阈值,则将所述第一列表头确定为所述指定列表头。

7.一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至5中任一项所述方法的步骤。

8.一种存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至5中任一项所述的方法的步骤。