欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2022100006873
申请人: 南京信息工程大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-02-23
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种面向网络管理系统的故障检测方法,其特征在于,包括以下步骤:步骤1、获取原始不均衡网络故障数据集NF,对NF进行压缩和过滤操作,得到处理后数据集NF',NF'包括样本,样本包括两种类型样本,两种类型样本是指非故障样本和故障样本;

步骤2、获取不均衡比例I,所述不均衡比例I=非故障样本的数目/故障样本的数目;

步骤3、预先设置一个采样后的两种类型样本数目的比例I′,I′>I,根据I′获取新合成故障数据样本的数目N,N=I′×故障样本的数目‑非故障样本的数目;

步骤4、构建新合成故障数据样本的空间分布分配规则:首先对于故障样本,使用k‑means方法聚类划分为K个子簇;

其次对于非故障样本和故障样本划分后的各个子簇,分别获取非故障样本的类中心以及故障样本每个子簇的簇中心,得到各子簇簇中心到非故障样本的类中心的类‑簇间距离;

根据第i子簇簇中心到非故障样本的类中心的类‑簇间距离di,建立权重值计算公式,根据权重值计算公式和di计算出第i子簇的权重值获取故障样本的第i子簇待新合成的故障数据样本数Ni=Wi·N;

步骤5、构建新合成故障数据样本的合成规则:首先以子簇为单位,遍历第i子簇中故障样本到该子簇簇中心的距离,故障样本按距离大小升序排列,选取前Mi个故障数据样本作为第i子簇的优选样例Ai,根据合成方法,使用Ai合成第i子簇的新故障数据样本;其中, k为基于K近邻算法寻找某一优选样例的k个最近的邻居样本;

之后,将各子簇的新故障数据样本加入到NF'中,获得均衡数据集NFB;

步骤6、建立XGB‑RF网络故障检测模型:首先,获得NFB中的第m个样本特征vm,利用XGBoost算法构建出分类效果最优的XGBoost模型;其中,m=1,2,3,…M,M为样本特征总数;

根据每个vm在XGBoost算法中的所有树中分割训练NFB的次数,计算vm的重要性得分Sm,选择n个Sm值最大的样本特征,1

将完成特征选择的NFB输入到随机森林模型中,实现网络故障检测模型的构建。

2.根据权利要求1所述的一种面向网络管理系统的故障检测方法,其特征在于,步骤6中,所述特征重要性得分 其中 表示损失函数,n‘m表示在构建出分类效果最优的XGBoost模型的过程中、使用vm分割训练NFB的次数,n′为初始迭代次数,γ表示惩罚系数,λ表示惩罚项,wL和wR分别表示vm分割后得到的左子树和右子树的权重。

3.根据权利要求1所述的一种面向网络管理系统的故障检测方法,其特征在于,第i子簇簇中心到非故障样本的类中心的类‑簇间距离其中,非故障样本的类中心是通过求类中所有数据点的平均值求得的,即(A1,A2,…,AM)为非故障样本中每个特征中所有样本的均值; 为第i子簇的簇中心, 表示第i子簇簇中心样本的第m特征的值,Am为非故障样本中第m特征。

4.基于权利要求1所述的一种面向网络管理系统的故障检测方法的装置,其特征在于,包括数据预处理模块、故障数据样本获取模块、处理模块、新样本合成模块以及故障检测模块,其中,

数据预处理模块,用于原始不均衡网络故障数据的压缩和过滤操作,得到处理后数据集NF';

故障数据样本获取模块,用于获取NF';

处理模块,用于计算故障样本各簇待新合成的故障数据样本数;

新样例合成模块:用于构建新合成故障数据样本的合成规则,获得均衡数据集NFB;

故障检测模块,用于建立XGB‑RF网络故障检测模型,实现网络故障检测。