欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 202210821750X
申请人: 南昌工程学院
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2023-12-11
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种考虑需求响应用户关键特征的双层聚类修正方法,其特征在于,步骤如下:

步骤S1,获取用户用电数据集并进行降维处理:获取开展需求响应地区用户用电数据集和用户家庭特征问卷调查数据,通过长短期记忆神经网络对缺失值进行拟合,并采用PCA对用户用电数据集进行降维处理;

步骤S2,第一层聚类分析:针对用户用电数据集所形成的用户用电负荷曲线的特点,利用集成聚类算法整合各成员算法的优势,对用户用电数据集进行第一层聚类分析;

步骤S3,获取关键家庭特征因素:将步骤S2中的第一层聚类分析结果作为回归分析的因变量输入多元逻辑回归模型,用户家庭特征问卷调查数据进行特征编码后作为自变量和协变量输入多元逻辑回归模型进行回归分析,通过显著性判别用户家庭特征问卷调查数据的质量,最后得到修正后的影响用户用电特性的关键家庭特征因素,对关键家庭特征因素进行字段方式的编码,将用户家庭特征问卷调查数据转换成可进行聚类分析的数值形式;

步骤S4,第二层聚类分析:以步骤S2得到的第一层聚类分析结果和步骤S3得到的关键家庭特征因素为基础对属于同一类的用户群体进行第二层聚类分析;

步骤S5,训练并修正第二层聚类分析结果:将第二层聚类分析结果和用户家庭特征问卷调查数据作为Levy飞行策略和蝴蝶耦合灰狼优化算法优化SVM模型的训练数据集,进行训练,修正第二层聚类分析结果,得到考虑用户用电信息和多维影响因素的聚类分析结果。

2.根据权利要求1所述的考虑需求响应用户关键特征的双层聚类修正方法,其特征在于,所述步骤S1中,步骤S1.1,通过长短期记忆神经网络对缺失值进行拟合填补;得到m个样本,f个维度的用户用电数据集X:式中,用户用电数据集X为m×f阶的矩阵,Xvb为用户用电数据集X中的第v行第b列的元素,其中1≤v≤m,1≤b≤f,m为用户用电数据集矩阵的行数,f为用户用电数据集矩阵的列数;

步骤S1.2,以步骤S1.1得到的用户用电数据集X为基础进行PCA降维。

3.根据权利要求2所述的考虑需求响应用户关键特征的双层聚类修正方法,其特征在于,PCA降维的详细流程如下:步骤S1.2.1,将用户用电数据集X表示成列向量的形式;

步骤S1.2.2,计算用户用电数据集X的样本特征的协方差矩阵,并对协方差矩阵进行奇异值求解得到特征值λ和特征向量μ,将特征值λ按照从大到小的顺序排序;

步骤S1.2.3,将特征值λ投影到选取的特征向量μ上,得到降维后的e维特征;假设e为1到f之间的自然数,且λ1>λ2…>λe,第e个特征值λe对应的维的信息贡献值等于0.8,将前e个特征值和相对应的e个特征向量提取出来,得到一组特征向量组{(λ1,μ1), (λ2,μ2), (λ3,μ3), …, (λe,μe)},其中λ1,λ2,λ3,…,λe分别为第1,2,3,…, e个特征值,μ1,μ2,μ3,…,μe分别为第1,2,3,…, e个特征向量;其中特征向量组中的特征向量是经过PCA主成分分析投影降维后得到,按照信息贡献值从大到小排序,剔除信息贡献值低的指标,留下信息贡献值高的指标,即重要的、对结果有主要影响的指标变量就是降维后留在特征向量组中的特征向量;

其中主成分分析的方式为:计算主成分的综合得分Z;

其中,Uo为第o个指标的信息贡献值,o是该指标在所有指标中的次序;若主成分的综合得分Z的得分超过预定的阈值,说明此次降维的结果符合标准,若得分未超过阈值则重复上述降维步骤,直至主成分的综合得分Z的得分超过阈值,输出降维结果;

步骤S1.2.4,得到降维后的数据集 :

其中,xvb为降维后的数据集 中的第v行第b列的元素,其中1≤v≤m,1≤b≤e。

4.根据权利要求3所述的考虑需求响应用户关键特征的双层聚类修正方法,其特征在于,步骤S2中,以步骤S1所得降维后的数据集 为基础,选用粒子群优化k‑means聚类,模糊C均值聚类,自组织映射神经网络SOM聚类和高斯模糊聚类作为集成聚类算法的4种成员聚类算法进行聚类分析。

5.根据权利要求4所述的考虑需求响应用户关键特征的双层聚类修正方法,其特征在于,步骤S2的过程如下:步骤S2.1,通过聚类有效性指标确定最佳聚类数目;聚类有效性指标通常用于评价聚类分析结果的质量从而选择合适的聚类数目,采用聚类轮廓系数确定最佳聚类数目;

步骤S2.2,通过DB指标评估聚类效果,进而确定基聚类算法;

步骤S2.3,将各成员聚类算法的结果通过一致性函数进行统一;

步骤S2.4,输出第一层聚类分析结果。

6.根据权利要求5所述的考虑需求响应用户关键特征的双层聚类修正方法,其特征在于,步骤S2.2所述DB指标计算方式如下:式中,k代表聚类个数;di代表第i类中所有样本到聚类中心的均值;dij代表第i类和第j类的距离;gi表示第i类的中心点;gj表示第j类的中心点;ci表示第i类中包含的样本容量,rij表示第i类的中心点与第j类的中心点的距离,x代表样本。

7.根据权利要求6所述的考虑需求响应用户关键特征的双层聚类修正方法,其特征在于,所述步骤S2.3中,首先选定一个聚类算法作为基准聚类算法,其余聚类算法与基准聚类算法作对比;假设基准聚类算法为Cref,将数据集划分为k类,构建一个基准聚类算法Cref和其他聚类算法的结果的统一矩阵Qref_n:式中, Qref_n是基准聚类算法Cref和第n个聚类算法Cn的结果的统一矩阵,ref≠n;该统一矩阵 Qref_n中的元素Sij表示基准聚类算法Cref中第i类与Cn中第j类之间重叠的样本数量,

0

8.根据权利要求7所述的考虑需求响应用户关键特征的双层聚类修正方法,其特征在于,步骤S4的过程为:步骤S4.1,将步骤S3得到的关键家庭特征作为聚类维度指标,以第一层聚类分析结果中的每一大类中包含的样本构建第二层聚类分析的样本数据集θ:θ=(θ1,θ2,⋯,θk),

其中, 

其中,样本数据集θ是一个用户家庭特征问卷调查数据的集合,θk是第一层聚类分析得到的第k个类中包含的用户家庭特征问卷调查数据样本矩阵;θhl代表第h行第l列的影响家庭用电的用户家庭特征问卷调查数据;

步骤S4.2,选择k‑means算法对样本数据集θ中的每一个用户家庭特征问卷调查数据样本矩阵进行聚类分析,输出聚类分析结果,并进行标记。

9.根据权利要求8所述的考虑需求响应用户关键特征的双层聚类修正方法,其特征在于,步骤S5中,采用Levy飞行策略和蝴蝶耦合灰狼优化算法寻找SVM模型的参数值,融合蝴蝶和Levy飞行策略的搜索方式控制灰狼算法的α狼、β狼和ω狼的种群更新,防止灰狼算法早熟收敛;

所述Levy飞行策略和蝴蝶耦合灰狼优化算法公式如下:

其中 表示猎物的位置向量, 表示灰狼的位置向量,t是迭代次数;代表个体

与猎物的距离; 是系数向量,系数向量 的随机产生可以有效避免算法陷入局部最优,r是[0,1]中的随机向量;

灰狼的位置向量由下式计算:

其中:A是Levy飞行路径,即迭代步长,u和v是符合正态分布的随机数, 和 代表u和v的取值分布的上限, 是标准Gamma函数,参数 的取值范围为(0,2);

灰狼的等级的第一级为领导狼用α狼表示;第二等级称为β狼,也就是帮助领导狼做决定的下属狼;第三等级称为ω狼,ω狼只需要服从领导狼和下属狼的命令;当灰狼不是α狼、β狼、ω狼时,灰狼就被称为δ狼;假设α狼、β狼和ω狼对猎物的潜在位置有了解,保存到目前为止获得的前三个最佳解决方案,并要求其他灰狼根据最佳搜索位置来更新α狼、β狼、ω狼的位置;

其中, 、 、 分别代表α狼、β狼和ω狼与其它个体间的距离, 、 、 分别代

表α狼、β狼和ω狼的当前位置, 代表当前灰狼的位置向量, 、 、 分别是α狼、β狼和ω狼系数向量;

引入 、 、 表示如下:

其中, 代表α狼的迁移轨迹, 代表β狼的迁移轨迹, 代表ω狼的迁移轨迹;

已知第t次的灰狼的位置,求取t+1次灰狼的迁移轨迹如下:

更新 、 和 ,并继续迭代更新α狼、β狼、ω狼的位置,直到达到终止条件即可。

10.一种实现权利要求1‑9任意一项所述方法的双层聚类修正装置,包括缺失值填补模块,降维模块,集成聚类模块,多元逻辑回归模块和Levy飞行策略和蝴蝶耦合灰狼优化算法SVM修正模块;所述缺失值填补模块封装长短期记忆神经网络算法,读取用户用电数据,基于长短期记忆神经网络算法特性填补用户用电缺失值;所述降维模块封装PCA降维算法,用于对高维度数据集进行降维处理;所述集成聚类模块封装聚类成员算法、改进轮廓系数算法、DB指标算法和聚类分析结果一致性函数;所述多元逻辑回归模块封装多元逻辑回归分析算法,精准建立因变量和自变量之间的关系,通过多元逻辑回归模块筛选出影响用户用电特性的关键家庭特征因素;Levy飞行策略和蝴蝶耦合灰狼优化算法SVM修正模块封装Levy飞行策略和蝴蝶耦合灰狼优化算法。