1.一种财务报销数据处理方法,其特征在于,所述处理方法包括:接收用户发送的报销申请,根据预设的信息模板获取含有分类标签的报销凭证影像,根据分类标签查询参考图幅,基于所述参考图幅对所述报销凭证影像进行几何校正;
将几何校正后的报销凭证影像输入训练好的第一分类器,基于第一分类器对所述报销凭证影像进行内容识别,根据内容识别结果确定存疑图像;
将所述存疑图像上传至人工端并接收人工标记结果,根据人工标记结果将存疑图像分别存储至第一样本库和第二样本库;所述第一样本库中的图像为有效图像,所述有效图像为有效的报销凭证影像,所述第二样本库中的图像为无效图像,所述无效图像为无效的报销凭证影像;
将所述存疑图像输入训练好的第二分类器,基于所述第二分类器对存疑图像进行特征识别,根据特征识别结果过滤存疑图像中的有效图像;
其中,所述第一分类器包括训练好的第一图像识别模型,所述第一图像识别模型为基于第一样本库训练得到的神经网络模型;
所述第二分类器包括训练好的特征识别模型和训练好的第二图像识别模型,所述第二图像识别模型为基于第二样本库训练得到的神经网络模型;所述特征识别模型与所述第二图像识别模型为竞争关系;
所述根据分类标签查询参考图幅,基于所述参考图幅对所述报销凭证影像进行几何校正的步骤包括:根据分类标签提取参考图幅,根据预设的采样频率在所述参考图幅中确定第一采样点;
比对所述参考图幅和所述报销凭证影像,确定至少两个不共线的映射向量;
根据所述映射向量和参考图幅中的采样点确定报销凭证影像中的第二采样点;
根据所述第一采样点和所述第二采样点确定坐标变换参数,根据坐标变换参数对报销凭证影像进行几何校正;
所述根据所述第一采样点和所述第二采样点确定坐标变换参数,根据坐标变换参数对报销凭证影像进行几何校正的步骤包括:以第一采样点为中心,在参考图幅中拷贝第一采样区域;
以第二采样点为中心,在报销凭证影像中拷贝第二采样区域;
将所述第一采样区域和所述第二采样区域输入同一图像‑数值转换模型,得到两个目标值;
计算两个目标值之间的偏差率,标记偏差率小于预设的偏差阈值的第一采样区域和第二采样区域;
统计标记的第一采样区域和第二采样区域对应的第一采样点和第二采样点,根据统计到的第一采样点和第二采样点的位置关系确定坐标变换参数;
根据坐标变换参数对报销凭证影像进行几何校正;
所述将所述存疑图像输入训练好的第二分类器,基于所述第二分类器对存疑图像进行特征识别,根据特征识别结果过滤存疑图像中的有效图像的步骤包括:在第二分类器加载特征识别模型和第二图像识别模型;
将所述存疑图像分别输入特征识别模型和第二图像识别模型,分别记录特征识别模型和第二图像识别模型的输出值;其中,存疑图像为第一标识值,有效图像为第二标识值;
实时比对同一存疑图像对应的两个输出值,标记两个输出值不同的存疑图像,并将所述存疑图像向人工端发送;
接收人工端的反馈信号,根据所述反馈信号生成特征识别模型和第二图像识别模型的准确度;
当第二图像识别模型的准确度大于特征识别模型的准确度时,在第二分类器仅加载第二图像识别模型。
2.根据权利要求1所述的财务报销数据处理方法,其特征在于,所述特征识别模型的工作步骤包括:根据预设的区域标记对存疑图像进行切分,得到子区域;所述区域标记包括信息区域和标识区域;
对标识区域进行轮廓识别,根据轮廓识别结果标记轮廓像素点;
遍历所述轮廓像素点,计算不同轮廓像素点处的轮廓曲率;
对所述信息区域进行文字识别,得到信息文本;
根据所述轮廓曲率和所述信息文本识别存疑图像中的有效图像。
3.根据权利要求2所述的财务报销数据处理方法,其特征在于,所述遍历所述轮廓像素点,计算不同轮廓像素点处的轮廓曲率的步骤包括:根据预设的遍历方向以所述轮廓像素点为中心,根据预设的半径截取轮廓;
根据截取到的轮廓计算轮廓曲率,得到轮廓曲率组。
4.根据权利要求3所述的财务报销数据处理方法,其特征在于,所述根据所述轮廓曲率和所述信息文本识别存疑图像中的有效图像的步骤包括:读取预存的标准轮廓,计算得到标准轮廓的参考曲率组;
读取所述轮廓曲率组,将所述轮廓曲率组与所述参考曲率组进行比对,根据比对结果筛选存疑图像中的预存图像;
读取预存图像对应的信息文本,对所述信息文本进行内容识别,根据内容识别结果在预存图像中提取有效图像。
5.一种财务报销数据处理系统,其特征在于,所述处理系统包括:影像获取模块,用于接收用户发送的报销申请,根据预设的信息模板获取含有分类标签的报销凭证影像,根据分类标签查询参考图幅,基于所述参考图幅对所述报销凭证影像进行几何校正;
第一识别模块,用于将几何校正后的报销凭证影像输入训练好的第一分类器,基于第一分类器对所述报销凭证影像进行内容识别,根据内容识别结果确定存疑图像;
样本库更新模块,用于将所述存疑图像上传至人工端并接收人工标记结果,根据人工标记结果将存疑图像分别存储至第一样本库和第二样本库;所述第一样本库中的图像为有效图像,所述有效图像为有效的报销凭证影像,所述第二样本库中的图像为无效图像,所述无效图像为无效的报销凭证影像;
第二识别模块,用于将所述存疑图像输入训练好的第二分类器,基于所述第二分类器对存疑图像进行特征识别,根据特征识别结果过滤存疑图像中的有效图像;
其中,所述第一分类器包括训练好的第一图像识别模型,所述第一图像识别模型为基于第一样本库训练得到的神经网络模型;
所述第二分类器包括训练好的特征识别模型和训练好的第二图像识别模型,所述第二图像识别模型为基于第二样本库训练得到的神经网络模型;所述特征识别模型与所述第二图像识别模型为竞争关系;
所述影像获取模块包括:
采样点确定单元,用于根据分类标签提取参考图幅,根据预设的采样频率在所述参考图幅中确定第一采样点;
向量确定单元,用于比对所述参考图幅和所述报销凭证影像,确定至少两个不共线的映射向量;
采样点映射单元,根据所述映射向量和参考图幅中的采样点确定报销凭证影像中的第二采样点;
处理执行单元,用于根据所述第一采样点和所述第二采样点确定坐标变换参数,根据坐标变换参数对报销凭证影像进行几何校正;
所述处理执行单元包括:
第一拷贝子单元,用于以第一采样点为中心,在参考图幅中拷贝第一采样区域;
第二拷贝子单元,用于以第二采样点为中心,在报销凭证影像中拷贝第二采样区域;
转换子单元,用于将所述第一采样区域和所述第二采样区域输入同一图像‑数值转换模型,得到两个目标值;
计算子单元,用于计算两个目标值之间的偏差率,标记偏差率小于预设的偏差阈值的第一采样区域和第二采样区域;
统计子单元,用于统计标记的第一采样区域和第二采样区域对应的第一采样点和第二采样点,根据统计到的第一采样点和第二采样点的位置关系确定坐标变换参数;
校正子单元,用于根据坐标变换参数对报销凭证影像进行几何校正;
所述将所述存疑图像输入训练好的第二分类器,基于所述第二分类器对存疑图像进行特征识别,根据特征识别结果过滤存疑图像中的有效图像的内容包括:在第二分类器加载特征识别模型和第二图像识别模型;
将所述存疑图像分别输入特征识别模型和第二图像识别模型,分别记录特征识别模型和第二图像识别模型的输出值;其中,存疑图像为第一标识值,有效图像为第二标识值;
实时比对同一存疑图像对应的两个输出值,标记两个输出值不同的存疑图像,并将所述存疑图像向人工端发送;
接收人工端的反馈信号,根据所述反馈信号生成特征识别模型和第二图像识别模型的准确度;
当第二图像识别模型的准确度大于特征识别模型的准确度时,在第二分类器仅加载第二图像识别模型。