1.一种融合深度神经网络和层级注意力机制的恶意流量检测方法,其特征在于,包括以下步骤:S1,获取原始流量数据,对获取的所述原始流量数据保存为能识别的文件格式的流量数据;
S2,对步骤S1中保存的流量数据进行特征转换;
S3,对步骤S2中转换后的流量数据进行数据包分段,得到数据包段;
S4,通过时序处理特征向量捕获每个数据包段之间的特征信息;
S5,分配得到注意力向量;
S6,对其流量数据进行特征融合;
S7,对其步骤S6中融合的特征进行线性变换;
S8,将流量数据进行分类。
2.根据权利要求1所述的融合深度神经网络和层级注意力机制的恶意流量检测方法,其特征在于,在步骤S1中,原始流量数据的获取方法为采用抓包工具,并把抓好的数据包保存为pcap文件格式的流量数据;
在步骤S2中,对保存的流量数据进行特征转换的方法为利用CICFlowmeter-V4.0特征转换工具,将pcap数据解析成79个数字特征,即每一个数据包由一个79维度向量构成;
在步骤S3中,对流量数据进行数据包分段的方法为根据时间的先后顺序把流量数据按长度l进行分段,每个数据包段中有l个数据分段,记作[l,f],f表示每个数据分段中的特征数量。
3.根据权利要求2所述的融合深度神经网络和层级注意力机制的恶意流量检测方法,其特征在于,在步骤S2中,利用CICFlowMeter-V4.0工具提取到的特征,若样本存在缺失值,则对缺失值的特征采用平均值法进行处理,即是利用其他样本未在该特征上未缺失进行加权平均,然后将其补上。
4.根据权利要求1所述的融合深度神经网络和层级注意力机制的恶意流量检测方法,其特征在于,步骤S4包括以下步骤:S41,根据输入的流量数据计算获得更新门数据;
S42,根据输入的流量数据计算得到重置门数据;
S43,根据步骤S41计算得到当前内存内容;
S44,根据步骤S42和步骤S43获取在当前时间步长的最后内存内容。
5.根据权利要求4所述的融合深度神经网络和层级注意力机制的恶意流量检测方法,其特征在于,在步骤S41中,更新门数据的计算方法为:zt=σ(Wzxt+Uzht-1),Wz表示更新门的权重;
xt表示时刻t输入的数据;
Uz表示前一时刻隐藏状态矩阵ht-1的更新门权重;
ht-1表示t-1时刻隐藏状态矩阵;
zt表示更新门数据;
在步骤S42中,重置门数据的计算方法为:rt=σ(Wrxt+Urht-1),Wr表示重置门的权重;
xt表示时刻t输入的数据;
Ur表示前一时刻隐藏状态矩阵ht-1的重置门权重;
ht-1表示t-1时刻隐藏状态矩阵;
rt表示重置门数据;
在步骤S43中,当前内存内容的计算方法为:Wh表示流量数据xt的权重矩阵;
xt表示时刻t输入的数据;
rt表示重置门数据;
⊙表示按元素点乘;
U表示候选集的权重;
ht-1表示t-1时刻的隐藏状态矩阵;
tanh()表示双曲正切函数;
表示当前候选集;
在步骤S44中,最后内存内容的计算方法为:zt表示更新门数据;
ht-1表示t-1时刻隐藏状态矩阵;
表示当前候选集;
ht表示t时刻的隐藏状态矩阵。
6.根据权利要求1所述的融合深度神经网络和层级注意力机制的恶意流量检测方法,其特征在于,在步骤S5中,注意力向量的计算方法为:ui=tanh(Wwhi+bw),tanh()表示双曲正切函数;
Ww表示隐藏状态矩阵hi的权重矩阵;
hi表示GRU模型在i时刻输出的隐藏状态矩阵;
bw表示权重矩阵Ww的偏置;
ui表示经过一层感知机后计算得到的值;
ui表示经过一层感知机后计算得到的值;
T表示矩阵的转置;
uw表示注意力权重矩阵;
l表示数据包段中数据分段的个数;
αi表示权重占比矩阵;
Vi=∑lαihi,
αi表示权重占比矩阵;
hi表示GRU模型在i时刻输出的隐藏状态矩阵;
Vi表示注意力机制加权后注意力向量;
l表示数据包段中数据分段的个数。
7.根据权利要求1所述的融合深度神经网络和层级注意力机制的恶意流量检测方法,其特征在于,在步骤S6中,对其流量数据进行特征融合的计算方法为:max()表示取最大值函数;
Ci,j表示隐藏层h矩阵中i行j列的值;
Ci,j+1表示隐藏层h矩阵中i行j+1列的值;
得到一维的向量
8.根据权利要求1所述的融合深度神经网络和层级注意力机制的恶意流量检测方法,其特征在于,在步骤S7中,对其融合的特征进行线性变换的计算方法为:H表示下一层有多少个神经单元;
Wkj表示第j个稠密单元的权重向量;
xk表示输入的信息;
bj表示第j个稠密单元的偏差;
f()表示激活函数;
将每个单元的输出连接起来得到稠密结果D=[D1,D2,D3,...,Dl]。
9.根据权利要求1所述的融合深度神经网络和层级注意力机制的恶意流量检测方法,其特征在于,在步骤S8中,对流量数据的分类方法为:是归一化的因子;
y(i)表示第i个样本的标签值;
x(i)表示第i个样本的值;
θ表示模型中被训练的权重;
K表示分类的类别数;
T表示矩阵的转置;
P(|)表示条件概率;
若样本分类概率hθ(x(i))在预设样本分类阈值范围内,则该样本为正常流量;
若样本分类概率hθ(x(i))未在预设样本分类阈值范围内,则该样本为恶意流量。