1.一种面向网络管理系统的故障检测方法,其特征在于,包括以下步骤:步骤1、获取原始不均衡网络故障数据集NF,对NF进行压缩和过滤操作,得到处理后数据集NF',NF'包括样本,样本包括两种类型样本,两种类型样本是指非故障样本和故障样本;
步骤2、获取不均衡比例I,所述不均衡比例I=非故障样本的数目/故障样本的数目;
步骤3、预先设置一个采样后的两种类型样本数目的比例I′,I′>I,根据I′获取新合成故障数据样本的数目N,N=I′×故障样本的数目‑非故障样本的数目;
步骤4、构建新合成故障数据样本的空间分布分配规则:首先对于故障样本,使用k‑means方法聚类划分为K个子簇;
其次对于非故障样本和故障样本划分后的各个子簇,分别获取非故障样本的类中心以及故障样本每个子簇的簇中心,得到各子簇簇中心到非故障样本的类中心的类‑簇间距离;
根据第i子簇簇中心到非故障样本的类中心的类‑簇间距离di,建立权重值计算公式,根据权重值计算公式和di计算出第i子簇的权重值获取故障样本的第i子簇待新合成的故障数据样本数Ni=Wi·N;
步骤5、构建新合成故障数据样本的合成规则:首先以子簇为单位,遍历第i子簇中故障样本到该子簇簇中心的距离,故障样本按距离大小升序排列,选取前Mi个故障数据样本作为第i子簇的优选样例Ai,根据合成方法,使用Ai合成第i子簇的新故障数据样本;其中, k为基于K近邻算法寻找某一优选样例的k个最近的邻居样本;
之后,将各子簇的新故障数据样本加入到NF'中,获得均衡数据集NFB;
步骤6、建立XGB‑RF网络故障检测模型:首先,获得NFB中的第m个样本特征vm,利用XGBoost算法构建出分类效果最优的XGBoost模型;其中,m=1,2,3,…M,M为样本特征总数;
根据每个vm在XGBoost算法中的所有树中分割训练NFB的次数,计算vm的重要性得分Sm,选择n个Sm值最大的样本特征,1
将完成特征选择的NFB输入到随机森林模型中,实现网络故障检测模型的构建。
2.根据权利要求1所述的一种面向网络管理系统的故障检测方法,其特征在于,步骤6中,所述特征重要性得分 其中 表示损失函数,n‘m表示在构建出分类效果最优的XGBoost模型的过程中、使用vm分割训练NFB的次数,n′为初始迭代次数,γ表示惩罚系数,λ表示惩罚项,wL和wR分别表示vm分割后得到的左子树和右子树的权重。
3.根据权利要求1所述的一种面向网络管理系统的故障检测方法,其特征在于,第i子簇簇中心到非故障样本的类中心的类‑簇间距离其中,非故障样本的类中心是通过求类中所有数据点的平均值求得的,即(A1,A2,…,AM)为非故障样本中每个特征中所有样本的均值; 为第i子簇的簇中心, 表示第i子簇簇中心样本的第m特征的值,Am为非故障样本中第m特征。
4.基于权利要求1所述的一种面向网络管理系统的故障检测方法的装置,其特征在于,包括数据预处理模块、故障数据样本获取模块、处理模块、新样本合成模块以及故障检测模块,其中,
数据预处理模块,用于原始不均衡网络故障数据的压缩和过滤操作,得到处理后数据集NF';
故障数据样本获取模块,用于获取NF';
处理模块,用于计算故障样本各簇待新合成的故障数据样本数;
新样例合成模块:用于构建新合成故障数据样本的合成规则,获得均衡数据集NFB;
故障检测模块,用于建立XGB‑RF网络故障检测模型,实现网络故障检测。