1.一种敏感数据的脱敏方法,其特征在于,所述方法包括:根据预设的数据传输规则组建数据脱敏策略库;其中,所述根据预设的数据传输规则组建数据脱敏策略库,包括:统计并预处理预设的数据传输规则,生成汇总结果;
根据预先设定的语义类别将所述汇总结果中的数据传输规则进行类别拆分,生成多种拆分项;
接收针对所述多种拆分项中各拆分项制定的脱敏规则;
将所述接收到的脱敏规则与其对应的拆分项进行绑定,生成多种绑定脱敏规则的拆分项;
针对所述多种绑定脱敏规则的拆分项逐一构建脱敏原型,生成多种脱敏原型;
利用所述多种脱敏原型组建生成数据脱敏策略库;其中,所述统计并预处理预设的数据传输规则,生成汇总结果,包括:统计预设的数据传输规则;其中,所述数据传输规则至少包括数据传输的基本要求与条例;
查询统计的所述数据传输规则中是否存在残缺的基本要求与条例;
若是,遍历获取所述残缺的基本要求与条例;
针对所述残缺的基本要求与条例进行清除或者修复,生成汇总结果;
实时获取目标系统内交互及展示的数据信息,并针对所述数据信息进行模糊匹配,确定所述数据信息中是否存在敏感数据;其中,所述针对所述数据信息进行模糊匹配,确定所述数据信息中是否存在敏感数据,包括:拆解所述数据信息的报文体结构,生成多种拆分后的报文;
采用预设多个正则项与模式识别算法针对所述多种拆分后的报文进行模糊匹配,生成匹配结果;
基于所述匹配结果确定所述数据信息中是否存在敏感数据;其中,所述采用预设多个正则项与模式识别算法针对所述多种拆分后的报文进行模糊匹配,包括:加载预设多个正则项;
初始化AC自动机匹配算法;
将所述多种拆分后的报文确定为主串;
将所述多个正则项确定为模式串;
将所述主串与所述模式串输入初始化后的AC自动机匹配算法中,输出所述主串在所述模式串中的位置下标;
将所述位置下标确定为匹配结果;
当存在敏感数据时,从所述数据信息中提取所包含的敏感数据;
识别提取的所述敏感数据对应的语义类别,并从所述数据脱敏策略库中读取所述语义类别对应的脱敏规则;
根据所述脱敏规则将提取的所述敏感数据进行数据转换,生成脱敏数据。
2.根据权利要求1所述的方法,其特征在于,所述根据预先设定的语义类别将所述汇总结果中的数据传输规则进行类别拆分,生成多种拆分项,包括:采用滑动窗口算法创建目标滑动窗口;
获取预先设定的多种语义类别;
将所述预先设定的多种语义类别与所述目标滑动窗口进行绑定,生成绑定语义类别的目标滑动窗口;
将所述汇总结果中的数据传输规则逐一输入所述绑定语义类别的目标滑动窗口中,输出多种拆分项。
3.根据权利要求1所述的方法,其特征在于,所述识别提取的所述敏感数据对应的语义类别,包括:加载预先训练的语义识别模型;
将所述敏感数据输入所述预先训练的语义识别模型中,输出所述敏感数据对应的语义类别;
其中,所述语义识别模型按照以下步骤训练生成,包括:采用卷积神经网络创建语义识别模型;
采集银行规定的数据传输规则;
标注所述采集到的每条数据传输规则的语义类别后生成训练集;
将所述训练集输入所述语义识别模型中进行训练后输入模型的损失值;
当所述模型的损失值到达预设阈值时,生成预先训练的语义识别模型。
4.一种敏感数据的脱敏装置,其特征在于,所述装置包括:策略库组件模块,用于根据预设的数据传输规则组建数据脱敏策略库;其中,所述策略库组件模块具体用于:统计并预处理预设的数据传输规则,生成汇总结果;
根据预先设定的语义类别将所述汇总结果中的数据传输规则进行类别拆分,生成多种拆分项;
接收针对所述多种拆分项中各拆分项制定的脱敏规则;
将所述接收到的脱敏规则与其对应的拆分项进行绑定,生成多种绑定脱敏规则的拆分项;
针对所述多种绑定脱敏规则的拆分项逐一构建脱敏原型,生成多种脱敏原型;
利用所述多种脱敏原型组建生成数据脱敏策略库;其中,所述统计并预处理预设的数据传输规则,生成汇总结果,包括:统计预设的数据传输规则;其中,所述数据传输规则至少包括数据传输的基本要求与条例;
查询统计的所述数据传输规则中是否存在残缺的基本要求与条例;
若是,遍历获取所述残缺的基本要求与条例;
针对所述残缺的基本要求与条例进行清除或者修复,生成汇总结果;
敏感数据查询模块,用于实时获取目标系统内交互及展示的数据信息,并针对所述数据信息进行模糊匹配,确定所述数据信息中是否存在敏感数据;其中,所述针对所述数据信息进行模糊匹配,确定所述数据信息中是否存在敏感数据,包括:拆解所述数据信息的报文体结构,生成多种拆分后的报文;
采用预设多个正则项与模式识别算法针对所述多种拆分后的报文进行模糊匹配,生成匹配结果;
基于所述匹配结果确定所述数据信息中是否存在敏感数据;其中,所述采用预设多个正则项与模式识别算法针对所述多种拆分后的报文进行模糊匹配,包括:加载预设多个正则项;
初始化AC自动机匹配算法;
将所述多种拆分后的报文确定为主串;
将所述多个正则项确定为模式串;
将所述主串与所述模式串输入初始化后的AC自动机匹配算法中,输出所述主串在所述模式串中的位置下标;
将所述位置下标确定为匹配结果;
敏感数据提取模块,用于当存在敏感数据时,从所述数据信息中提取所包含的敏感数据;
脱敏规则读取模块,用于识别提取的所述敏感数据对应的语义类别,并从所述数据脱敏策略库中读取所述语义类别对应的脱敏规则;
脱敏数据生成模块,用于根据所述脱敏规则将提取的所述敏感数据进行数据转换,生成脱敏数据。
5.一种设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行如权利要求1至3中任一项权利要求所述敏感数据的脱敏方法的步骤。
6.一种存储有计算机可读指令的介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行如权利要求1至3中任一项权利要求所述敏感数据的脱敏的步骤。