1.一种基于马尔可夫矩阵的数据包特征值存储方法,其特征在于,包括:对网络传输中的数据包进行捕捉,基于获得的数据包构建数据包集合,记为,其中, 为数据包集合中数据包的个数;
从 开始,步长为1,直至 结束,遍历提取所述数据包的特征值,记录所述数据包集合中每一个数据包的传输方向,记为 ;其中, 为第 个数据包的传输方向,取值范围为 ;
对提取到的所述特征值进行离散化,获得离散化后的特征值;
根据所述离散化后的特征值建立基于马尔科夫链的状态转移矩阵,将得到的 个马尔可夫矩阵 进行拼接,获得 即为所求。
2.根据权利要求1所述的基于马尔可夫矩阵的数据包特征值存储方法,其特征在于,所述从 开始,步长为1,直至 结束,遍历提取所述数据包的特征值的过程包括,提取所述数据包集合中每一个数据包的特征值,将第 个数据包的 个特征值分别存储于矩阵 至 中;其中, , ,为特征值的数量,由选取的特征值所决定。
3.根据权利要求1所述的基于马尔可夫矩阵的数据包特征值存储方法,其特征在于,所述 为第 个数据包的传输方向,取值范围为 ,若 ,则第 个数据包为出站数据包;若 ,则第 个数据包为入站数据包。
4.根据权利要求1所述的基于马尔可夫矩阵的数据包特征值存储方法,其特征在于,所述对提取到的所述特征值进行离散化的过程包括,当各个箱子宽度相同时,从 开始,步长为1进行遍历,直至 结束;
过程包括:
选取特征值矩阵 ,定义 ;从 开始,步长为1进行遍历,直至结束:
然后根据公式 计算箱容量,得到分箱范围:, ,…, ;其中, 为人为
设定的箱数量;
将各个数据包按照第 个特征值的值,放入对应的箱中,完成第 个特征值离散化。
5.根据权利要求4所述的基于马尔可夫矩阵的数据包特征值存储方法,其特征在于,所述选取特征值矩阵 ,定义 ;从 开始,步长为1进行遍历,直至 结束的过程包括,
计算 ,当 时,令 ;
当 时,令
特殊的,当 时, 。
6.根据权利要求1所述的基于马尔可夫矩阵的数据包特征值存储方法,其特征在于,所述对提取到的所述特征值进行离散化的过程还包括,当各个箱子容量相同时,确定分位数 ,得到箱容量 ;其中, 为数据包数量, 为向下取整函数,分位数 是指将一个随机变量的概率分布范围分为几个等份的数值点;
从 开始,步长为1进行遍历,直至 结束;选取特征值矩阵 ,定义排序矩阵;
从 开始,步长为1进行遍历,直至 结束:按照特征值排序 、箱容量 ,将各个数据包进行归类,放入不同箱子中,完成离散化装箱。
7.根据权利要求6所述的基于马尔可夫矩阵的数据包特征值存储方法,其特征在于,所述从 开始,步长为1进行遍历,直至 结束的过程包括,将 中各个元素的大小进行排序,并记录对应的数据包编号;
检索 中的特征值,按从小到大的顺序找出第 个的特征值,并将所述特征值对应的数据包编号作为 的值。
8.根据权利要求7所述的基于马尔可夫矩阵的数据包特征值存储方法,其特征在于,根据所述离散化后的特征值建立基于马尔科夫链的状态转移矩阵的过程包括,从 开始,步长为1进行遍历,直至 结束;
根据数据包的五元组化分源地址、源端口、目的地址、目的端口、传输层协议,将属于同一个流的数据包关联起来,获得关联结果;
基于所述关联结果,根据每一个流的数据包的传输顺序,依次计算每一个特征值中箱跳转的次数,将计算结果存储于矩阵 中;
根据所述计算结果计算箱子之间的跳转概率,基于所述跳转概率获得所述状态转移矩阵。
9.根据权利要求8所述的基于马尔可夫矩阵的数据包特征值存储方法,其特征在于,所述矩阵 的表达式为:;
其中, 为箱数量, 表示从第n个箱子跳转至第1个箱子的次数。
10.根据权利要求8所述的基于马尔可夫矩阵的数据包特征值存储方法,其特征在于,所述跳转概率公式为:;
所述状态转移矩阵公式为:
。