1.一种基于决策树的多分类网络故障预测方法,其特征在于,通过以下步骤1至步骤3构建多分类网络故障决策树模型,通过步骤A确定目标场景中的分类结果;
步骤1、基于预设网络故障数据集内各个样本中指定各个网络特征、以及所对应的网络状态类型,构建各种网络状态类型分别一一对应的大类,并分别针对各个大类,由所对应网络状态类型构建为大类中的一小类,以及将网络故障数据集中除该网络状态类型以外、其余各种网络状态类型,组合构建为该大类中的非一小类;待分别完成各个大类的构建之后,然后进入步骤2;
步骤2、根据大类中一小类和非一小类各自的类中心,计算各个大类中两小类所对应的类间距,并根据类间距由大至小顺序,针对各个大类进行排序,并按此排序依次获得各个大类中一小类的网络状态类型的排序,即为各个网络状态类型之间的排序,然后进入步骤3;
步骤3、分别针对每个网络状态类型,从网络故障数据集中调取属于网络状态类型所对应的各个样本,并进行机器学习,获得该网络状态类型所对应样本中各个网络特征为输入、样本中所对应网络状态类型为输出的网络分类模型;进而获得各个网络状态类型分别所对应的网络分类模型;
根据各个网络状态类型之间的排序、以及各个网络状态类型分别所对应的网络分类模型,构建多分类网络故障决策树模型;
步骤A、提取目标场景中与网络故障数据集内样本中各个网络特征相同的网络特征的数据,应用多分类网络故障决策树模型,针对该各个网络特征的数据进行处理,获得目标场景所对应的分类结果。
2.根据权利要求1所述的一种基于决策树的多分类网络故障预测方法,其特征在于,所述预设网络故障数据集内各个样本中的指定网络特征为41个,其中第1个至第9个为TCP连接基本特征、第10个至第22个为TCP连接的内容特征、第23个至第31个为基于时间的网络流量统计特征、第32个至第41个为基于主机的网络流量统计特征。
3.根据权利要求1所述的一种基于决策树的多分类网络故障预测方法,其特征在于,所述步骤1中网络状态类型为5类,分别为N类,表示正常;P类,表示端口监视或扫描;D类,表示拒绝服务攻击;U类,表示未授权的本地超级用户特权访问;R类,表示来自远程主机的未授权访问。
4.根据权利要求1所述的一种基于决策树的多分类网络故障预测方法,其特征在于,所述步骤1中,首先预设网络故障数据集采用数据数值化和归一化进行数据预处理,然后进行各个大类的构建。
5.根据权利要求1所述的一种基于决策树的多分类网络故障预测方法,其特征在于,所述步骤2中各个大类的类间距,计算公式如下:首先求得每组中一小类和非一小类的类中心:
其中:M表示一小类所有样本中第i特征的平均值,M′表示非一小类所有样本中第i’特征的平均值;N、N′分别表示一小类、非一小类中的样本总数;n表示样本中所指定的特征数;
i、i′分别表示一小类、非一小类样本的序号;j表示样本中特征的序号,Xij表示一小类中第i个样本中的第j个特征;X′i′j表示非一小类中第i′个样本中的第j个特征;
最后求得每组中一小类和非一小类的类间距离为:
6.根据权利要求1所述的一种基于决策树的多分类网络故障预测方法,其特征在于,所述步骤3中构建多分类网络故障决策树模型过程的算法采用CART算法。
7.根据权利要求4所述的一种基于决策树的多分类网络故障预测方法,其特征在于,对预设网络故障数据集预处理之后的数据进行PAC降维操作。