1.一种基于数据分析的风险监测预警系统,其特征在于:该预警系统包括数据采集模块、数据处理模块、运行管理模块和数据备份模块;
所述数据采集模块用于采集所有用户的操作信息,以及用户计算机内的文件信息;所述数据处理模块通过操作信息和文件信息筛选出数据漏存率高的异常用户,对这些异常用户计算机内的文件进行分析判断,找出重点文件进行监测;所述运行管理模块用于对重点文件的操作进行风险程度分析,高风险操作情况下及时给用户发送预警信息,根据用户回馈进行对应操作;所述数据备份模块用于对用户需要保存的文件进行备份;
对异常用户的筛选步骤如下:
S101、获取指定区域内所有用户的操作信息,以及用户计算机内的文件信息;操作信息包括打开操作、关闭操作、清理操作和保存操作,以及这些操作对应的时间;文件信息包括文件格式、文件名称和有效期;
S102、识别每个用户打开操作的失败次数,打开失败是指用户打开文件时,对应文件超过有效期被系统自动清理了,文件无法被打开导致打开失败;筛选出打开失败次数不为零的用户,对这些用户进行标记;
S103、获取被标记的用户计算机中保存文件的数量,与对应用户打开文件失败次数一起代入公式中,计算得到文件漏存率,依次筛选出文件漏存率大于漏存率阈值的用户,将这些用户定义为异常用户;公式如下:式中,result为用户类型判断结果,e为用户打开失败次数,f为用户保存文件的数量,F为漏存率阈值;
检测重点文件的步骤如下:
S201、获取所有异常用户计算机内的文件信息,按照是否被用户保存进行分类,划分为已存文件和未存文件;已存文件是指被用户保存的文件,未存文件是指没有被用户保存且没有超过有效期的文件;
S202、获取未存文件对应的操作信息,判断打开操作与关闭操作时间差,将该时间差定义为该文件的浏览时间;判断浏览时间是否大于时间阈值,结果为是,则将对应文件定义为重点文件,进入下一步骤;结果为否,则直接进入下一步骤;
S203、获取已存文件的格式信息,将这些信息放入格式信息集合X中,集合X内包括{QS204、获取已存文件的名称信息,将这些信息放入名称信息集合Y中,集合Y内包括{WS205、获取剩余没有被定义的未存文件的格式信息,依次判断是否属于格式信息集合,结果为是,则将对应的未存文件进行标记;结果为否,则将对应文件定义为普通文件;
S206、获取被标记文件的名称信息,依次与名称信息集合中每一个元素进行相似度计算,得到的相似度放入相似度集合Z中,每份被标记文件对应一个相似度集合,相似度计算步骤如下:S206-1、对文件名称进行分词处理,将每个名称转化为一个词语列表;
S206-2、去除每个词语列表中的重复词语,得到两个不同的词语集合;
S206-3、将两个不同的词语集合合并,得到总词语集合;
S206-4、将总词语集合中的每个词语构建出一个向量,向量的每一维表示该词语在文本中出现的次数;使用公式计算两个向量之间的相似度,公式如下:式中,cos(θ)为文件名称的相似度,|a|表示向量a的模,|b|表示向量b的模,a×b表示向量a和向量b的内积;
S207、判断每份被标记文件对应相似度集合中最大的数是否大于相似度阈值,结果为是,则将对应文件定义为重点文件;结果为否,则将对应文件定义为普通文件;判断公式如下:式中,FT为文件类型,GS为文件格式,X为格式信息集合,max(Z)为文件相似度集合中最大值,Z
2.根据权利要求1所述的一种基于数据分析的风险监测预警系统,其特征在于:所述数据采集模块包括操作信息采集单元和文件信息采集单元;
所述操作信息采集单元用于采集指定区域内所有用户对文件的操作信息,操作信息包括打开操作、关闭操作、清理操作和保存操作,以及这些操作对应的时间;
所述文件信息采集单元用于采集用户计算机内的文件信息,文件信息包括文件格式、文件名称和有效期。
3.根据权利要求1所述的一种基于数据分析的风险监测预警系统,其特征在于:所述数据处理模块包括用户筛选单元和文件定义单元;
所述用户筛选单元用于在指定区域内所有用户中筛选出异常用户;
首先,收集所有用户的操作信息,识别出用户打开失败的文件数量,同时获取对应用户保存的文件数量;其次,将两者数量信息代入公式中计算得到文件漏存率;最后,将文件漏存率大于漏存率阈值的用户筛选出来,定义为异常用户;
所述文件定义单元用于定义文件的状态信息和类型信息;状态信息包括已存和未存,类型信息包括重点和普通;
首先,收集所有异常用户计算机内的文件信息,按照是否被用户保存来区分已存文件和未存文件;其次,将未存文件浏览时间大于时间阈值的定义为重点文件;然后,根据已存文件的格式和名称建立格式信息集合和名称信息集合,判断未存文件格式是否属于格式信息集合,计算未存文件名称与名称信息集合中每一个元素的相似度;最后,将属于格式信息集合且最大相似度大于相似度阈值所对应的未存文件定义为重点文件,其他情况则定义为普通文件。
4.根据权利要求1所述的一种基于数据分析的风险监测预警系统,其特征在于:所述运行管理模块包括操作管理单元和风险管理单元;
所述操作管理单元用于判断用户操作的风险程度;实时获取异常用户的操作信息和文件信息进行监测,当用户对包含重点文件的文件夹进行清理操作,或者系统自动对时间到达有效期的重点文件进行清理操作时,判定为高风险操作;其他情况下,判定为低风险操作;
所述风险管理单元用于对高风险操作进行预警;当监测到高风险操作时,系统自动拦截对应操作,同时给对应用户发送预警信息,提醒用户针对清理行为做进一步确认,用户选择确认,则删除该文件或文件夹;用户选择取消,则跳转到数据备份模块。
5.根据权利要求1所述的一种基于数据分析的风险监测预警系统,其特征在于:所述数据备份模块用于将用户已经保存的文件以及需要保存的文件进行备份。
6.一种基于数据分析的风险监测预警方法,所述方法应用于权利要求1-5任一项所述的风险监测预警系统,其特征在于,该预警方法包括以下步骤:S1、在所有用户中筛选出异常用户;
S2、检测异常用户计算机内重点文件;
S3、监测对重点文件的所有操作,判断风险程度;
S4、针对高风险操作及时预警提醒。
7.根据权利要求6所述的一种基于数据分析的风险监测预警方法,其特征在于:在S3中,风险程度分为高风险和低风险;
高风险是指对重点文件的清理操作,当用户对包含重点文件的文件夹进行清理操作,或者系统自动对时间到达有效期的重点文件进行清理操作时,判定为高风险操作;低风险是指除高风险操作以外的所有操作。
8.根据权利要求6所述的一种基于数据分析的风险监测预警方法,其特征在于:在S4中,预警提醒是指当监测到高风险操作时,系统自动拦截对应操作,同时给对应用户发送预警信息,提醒用户对清理操作进行确认;用户选择确认,则删除该文件或文件夹;用户选择取消,则自动将对应重点文件进行备份。