欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2020115940284
申请人: 东北电力大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2023-12-11
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种电力CPS广义虚假数据注入攻击识别方法,其特征是,它包括的内容有:

1)信息物理融合数据平衡化处理方法

信息物理融合数据的平衡化处理由提出的中心化KMeans‑Smote过采样算法实现,首先计算数据集的不平衡率,当不平衡率低于50%时,执行过采样操作;然后明确各个待过采样类别生成的伪样本数量,求取各个类别样本平均数,将样本数量低于平均值的类别过采样至和平均值持平,不断循环上述过程,直至少数类样本数量和样本数量最多的类别的样本数量相等,从而明确各过采样阶段各少数类别生成的伪样本数量;最后执行过采样操作,过采样过程共分为聚类、过滤和线性插值三个阶段;

(1)聚类阶段,基于KMeans聚类算法将少数类样本在样本空间内聚类成n个簇,并为各个簇分配权重,分派原则为簇内样本数量多的簇的权重低,反之权重高,分配的权重决定该簇内生成的伪样本数量,权重越高,生成的伪样本数量越多,各簇在过采样过后包含的总样本数量大致相等,从而实现了类内的离散度平衡;

(2)过滤阶段,对于少数类样本,在样本空间内将孤立的、且和其他类别样本分类边界混淆不清的样本过滤掉,过滤掉的样本在过采样阶段不参与线性插值操作,即算法不会依据噪声样本生成伪样本,从而实现降噪处理;

(3)采样阶段,针对聚类所生成的各个簇,依次随机选择一个簇心,选取和簇心距离最近的k个近邻样本,在这些近邻样本中随机选择一个样本和所属的簇的簇心之间进行线性插值,生成一个伪样本,循环上述步骤,直到所有簇中的伪样本和步骤(1)中确定的权重约束相符,结束过采样操作,将所有过采样得到的伪样本以及步骤(2)中过滤掉的样本加入到原始数据集,得到平衡数据集,实现数据集的平衡化处理;

2)GFDIA识别最优特征子集确定方法

GFDIA识别最优特征子集的确定由最大化联合互信息(Joint Mutual Information Maximization,JMIM)特征选择算法实现,算法的输入是原始信息物理融合特征集F={f1,f2,...,fN},数据维数为N,输出为算法迭代选择的k个特征构成的GFDIA识别最优特征子集,其中k≤N;

3)基于改进深度森林的GFDIA识别器构建方法

一个深度森林算法的核心包含细粒度特征提取和级联森林两部分,

①细粒度特征提取:对于一个维度为P的样本,通过一个长度为k的采样滑动窗口,设滑动窗口的长度为λ,得到S=(P‑k)/λ+1个k维特征子样本向量,每个采样子样本用来训练第一层的基分类器,并在每个基分类器都获得一个长度为C的概率向量,最后把所有基分类器获得的概率向量以及原始特征拼接在一起得到特征提取结果;

②级联森林:深度森林算法采用一种级联结构对细粒度特征提取的结果进行逐层处理,每一级联层都将上一层的输出作为本层的输入,并将本层的特征处理结果输出到下一层,最终层将前面的级联层的预测结果求平均值得到最终预测值,从而加强算法的表征学习能力;

为了提升深度森林算法对GFDIA的辨识精度,并降低过拟合的风险,对级联层结构进行改进,具体改进方案如下:每个级联层配置6个基分类器,每个分类器都是基于决策树的集成学习算法,6个集成学习算法依次为Xgboost(EXtreme Gradient Boosting),随机森林(Random Forest),Lightgbm(Light Gradient Boosting Machine),极端森林(Extremely Randomized Trees),梯度提升决策树(Gradient Boosting Decision Tree),以及Adaboost(Adaptive Boosting)算法,各基分类器都是基于决策树的集成学习算法,学习机制也不完全相同,不同基分类器之间的差异性提升了深度森林在迭代过程中学习性能,改进后的深度森林算法即为GFDIA识别器;

4)得到电力CPS广义虚假数据注入攻击识别模型

(a)基于步骤1)提出的中心化KMeans‑Smote过采样方法对含标注的电力信息物理融合数据进行过采样处理,得到平衡化信息物理融合数据集;

(b)基于步骤2)提出的GFDIA识别最优特征子集确定方法,在信息物理融合的平衡数据集中提取GFDIA识别最优特征子集,实现数据的降维和去冗余处理;

(c)将操作(b)得到的GFDIA识别最优特征子集划分为训练集和测试集,划分比例为1:

1,训练集用来供模型的训练,测试集供模型的评估测试;

(d)按照步骤3)的改进方案配置级联层,采用训练集训练改进的深度森林分类器,得到电力CPS广义虚假数据注入攻击识别模型。