欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2020116060900
申请人: 平安普惠企业管理有限公司
专利类型:发明专利
专利状态:授权未缴费
专利领域: 计算;推算;计数
更新日期:2024-01-05
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种财务数据违规检测方法,其特征在于,包括:获取历史财务数据集,所述历史财务数据集包括多个标注了标签的财务数据,所述标签包括违规以及合规;对所述历史财务数据集进行数据清洗处理以得到样本数据集,所述样本数据集包括多个样本数据,所述样本数据由财务数据经过数据清洗处理后得到;根据所述样本数据集构建知识图谱,其中,所述知识图谱的节点为样本数据;获取所述知识图谱的节点的节点向量,并将所述知识图谱的节点的节点向量添加到预设的训练样本集中;通过所述训练样本集对预设的文本分类模型进行训练;若接收到初始财务数据,对所述初始财务数据进行数据清洗处理以得到待测财务数据;将所述待测财务数据添加到所述知识图谱中,并获取所述待测财务数据的节点向量;将所述待测财务数据的节点向量输入到训练后的文本分类模型中并输出所述待测财务数据的标签;若所述待测财务数据的标签为违规,向预设的监管终端发送违规告警消息。2.根据权利要求1所述的财务数据违规检测方法,其特征在于,所述根据所述样本数据集构建知识图谱,包括:将所述样本数据集中的样本数据作为知识图谱的节点添加到知识图谱的节点集合中;分别获取所述节点集合中任意两个节点之间的余弦距离;判断所述节点集合中的两个节点之间的余弦距离是否大于预设的余弦距离阈值;若所述节点集合中的两个节点之间的余弦距离大于预设的余弦距离阈值,在该两节点之间建立边,并将该两节点之间的边添加到知识图谱的边集合中。3.根据权利要求2所述的财务数据违规检测方法,其特征在于,所述获取所述知识图谱的节点的节点向量,包括:从所述知识图谱的节点出发,根据该节点与其它节点之间的边进行随机游走,得到预设长度的节点序列;对所述节点的节点序列进行分词处理以得到第一分词集合;对所述第一分词集合的词语进行词向量训练以得到所述第一分词集合的词语的词向量;将所述第一分词集合的词语的词向量输入到预设的双向GRU网络中,以由所述双向GRU网络输出所述节点的节点向量。4.根据权利要求3所述的财务数据违规检测方法,其特征在于,所述对所述节点的节点序列进行分词处理以得到第一分词集合,包括:通过预设分词工具将所述节点的节点序列划分为多个词语以得到第一初始分词集合;将所述第一初始分词集合中的停止词删除以得到所述第一分词集合。5.根据权利要求1所述的财务数据违规检测方法,其特征在于,所述通过所述训练样本集对预设的文本分类模型进行训练,包括:将训练样本集中的节点向量输入到所述文本分类模型中,并根据预设的反向传播算法对所述文本分类模型进行训练。

6.根据权利要求1所述的财务数据违规检测方法,其特征在于,所述将所述待测财务数据添加到所述知识图谱中,包括:将所述待测财务数据添加到所述知识图谱的节点集合中;分别获取所述待测财务数据与所述节点集合中的任意节点之间的余弦距离;判断所述待测财务数据与所述节点集合中的节点之间的余弦距离是否大于预设的余弦距离阈值;若所述待测财务数据与所述节点集合中的节点之间的余弦距离大于预设的余弦距离阈值,在所述待测财务数据与所述节点集合中的节点之间建立边,并将所述待测财务数据与所述节点集合中的节点之间的边添加到知识图谱的边集合中。7.根据权利要求5所述的财务数据违规检测方法,其特征在于,所述获取所述待测财务数据的节点向量,包括:从所述待测财务数据出发,根据所述待测财务数据与其它节点之间的边进行随机游走,得到预设长度的待测节点序列;对所述待测节点序列进行分词处理以得到第二分词集合;对所述第二分词集合的词语进行词向量训练以得到所述第二分词集合的词语的词向量;将所述第二分词集合的词语的词向量输入到预设的双向GRU网络中,以由所述双向GRU网络输出所述待测财务数据的节点向量。8.一种财务数据违规检测装置,其特征在于,包括:第一获取单元,用于获取历史财务数据集,所述历史财务数据集包括多个标注了标签的财务数据,所述标签包括违规以及合规;第一清洗单元,用于对所述历史财务数据集进行数据清洗处理以得到样本数据集,所述样本数据集包括多个样本数据,所述样本数据由财务数据经过数据清洗处理后得到;构建单元,用于根据所述样本数据集构建知识图谱,其中,所述知识图谱的节点为样本数据;第二获取单元,用于获取所述知识图谱的节点的节点向量,并将所述知识图谱的节点的节点向量添加到预设的训练样本集中;训练单元,用于通过所述训练样本集对预设的文本分类模型进行训练;第二清洗单元,用于若接收到初始财务数据,对所述初始财务数据进行数据清洗处理以得到待测财务数据;第三获取单元,用于将所述待测财务数据添加到所述知识图谱中,并获取所述待测财务数据的节点向量;输入单元,用于将所述待测财务数据的节点向量输入到训练后的文本分类模型中并输出所述待测财务数据的标签;发送单元,用于若所述待测财务数据的标签为违规,向预设的监管终端发送违规告警消息。9.一种计算机设备,其特征在于,所述计算机设备包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现如权利要求1‑7中任一项所述的方法。

10.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序当被处理器执行时可实现如权利要求1‑7中任一项所述的方法。