1.一种基于计算机网络安全的数据挖掘系统,其特征在于,包括:网络安全数据获取模块,用于获取由入侵检测系统采集的多个预定时间点的网络流量数据、从网络安全服务器采集的安全事件信息和从网络安全服务器采集的系统日志;
网络流量数据特征提取模块,用于对所述由入侵检测系统采集的多个预定时间点的网络流量数据进行特征提取以得到网络流量关联特征向量;
安全事件语义编码模块,用于对所述从网络安全服务器采集的安全事件信息进行安全事件语义编码以得到安全日志语义理解特征向量;
系统日志语义编码模块,用于对所述从网络安全服务器采集的系统日志进行系统日志语义编码以得到系统日志语义关联特征向量;
日志数据特征编码模块,用于对所述安全日志语义理解特征向量和所述系统日志语义关联特征向量进行特征编码以得到网络安全日志特征向量;
网络安全数据特征融合模块,用于将所述网络流量关联特征向量和所述网络安全日志特征向量进行融合以得到入侵告警分类特征向量;
入侵告警判断生成模块,用于将所述入侵告警分类特征向量通过分类器以得到分类结果,所述分类结果用于判断是否发出入侵告警;
其中,所述入侵告警判断生成模块,包括:
以如下差异性投影公式计算所述网络流量关联特征向量相对于所述网络安全日志特征向量的概率密度域维度衍生差异性投影以得到入侵告警分类特征向量;其中,所述差异性投影公式为:其中,
2.根据权利要求1所述的基于计算机网络安全的数据挖掘系统,其特征在于,所述网络流量数据特征提取模块,包括:网络流量数据排列单元,用于将所述由入侵检测系统采集的多个预定时间点的网络流量数据按照时间维度排列以得到网络流量输入向量;
网络流量特征编码单元,用于对所述网络流量输入向量进行特征编码以得到所述网络流量关联特征向量。
3.根据权利要求2所述的基于计算机网络安全的数据挖掘系统,其特征在于,所述网络流量特征编码单元,包括:将所述网络流量输入向量乘以其转置以得到网络流量关联矩阵;
将所述网络流量关联矩阵通过基于卷积神经网络的网络流量特征编码器以得到所述网络流量关联特征向量。
4.根据权利要求3所述的基于计算机网络安全的数据挖掘系统,其特征在于,所述安全事件语义编码模块,包括:将所述从网络安全服务器采集的安全事件信息进行分词以得到多个安全事件数据项;
将所述多个安全事件数据项通过包含嵌入层的安全事件信息上下文编码器以得到安全日志语义理解特征向量。
5.根据权利要求4所述的基于计算机网络安全的数据挖掘系统,其特征在于,所述系统日志语义编码模块,包括:将所述从网络安全服务器采集的系统日志通过包含嵌入层的系统日志上下文编码器以得到多个系统日志特征向量;
将所述多个系统日志特征向量进行级联以得到系统日志语义关联特征向量。
6.根据权利要求5所述的基于计算机网络安全的数据挖掘系统,其特征在于,所述日志数据特征编码模块,包括:日志特征关联单元,用于将所述安全日志语义理解特征向量和所述系统日志语义关联特征向量进行关联以得到网络安全日志关联特征矩阵;
日志特征编码单元,用于将所述网络安全日志关联特征矩阵通过基于深度卷积神经网络的网络安全日志特征编码器以得到所述网络安全日志特征向量。
7.根据权利要求6所述的基于计算机网络安全的数据挖掘系统,其特征在于,所述日志特征关联单元,包括:使用联合编码器以如下关联公式对所述安全日志语义理解特征向量和所述系统日志语义关联特征向量进行联合编码以生成所述网络安全日志关联特征矩阵;
其中,所述关联公式为:
其中
8.一种基于计算机网络安全的数据挖掘方法,使用权利要求1所述的基于计算机网络安全的数据挖掘系统,其特征在于,包括:获取由入侵检测系统采集的多个预定时间点的网络流量数据、从网络安全服务器采集的安全事件信息和从网络安全服务器采集的系统日志;
对所述由入侵检测系统采集的多个预定时间点的网络流量数据进行特征提取以得到网络流量关联特征向量;
对所述从网络安全服务器采集的安全事件信息进行安全事件语义编码以得到安全日志语义理解特征向量;
对所述从网络安全服务器采集的系统日志进行系统日志语义编码以得到系统日志语义关联特征向量;
对所述安全日志语义理解特征向量和所述系统日志语义关联特征向量进行特征编码以得到网络安全日志特征向量;
将所述网络流量关联特征向量和所述网络安全日志特征向量进行融合以得到入侵告警分类特征向量;
将所述入侵告警分类特征向量通过分类器以得到分类结果,所述分类结果用于判断是否发出入侵告警。
9.根据权利要求8所述的基于计算机网络安全的数据挖掘方法,其特征在于,对所述由入侵检测系统采集的多个预定时间点的网络流量数据进行特征提取以得到网络流量关联特征向量,包括:将所述网络流量输入向量乘以其转置以得到网络流量关联矩阵;
将所述网络流量关联矩阵通过基于卷积神经网络的网络流量特征编码器以得到所述网络流量关联特征向量。