1.一种集成电力负荷曲线聚类方法,其特征在于,所述方法包括以下步骤:获取原始电力负荷数据;
使用SOM神经网络对原始电力负荷数据进行粗聚类,获得聚类结果C1,具体包括以下步骤S1至S6:S1、初始化SOM神经网络神经元的权值向量和获胜神经元领域半径N0:wij=rand(0,1),1≤i≤m,1≤j≤n (1)其中,Wi为输出层第i个神经元的权值向量,Wi=[wi1,wi2,...,win];wij为Wi的第j个分量的值;n为输入层节点的个数,m为输出层神经元的个数;初始获胜神经元领域半径N是一个较大的值N0;
S2、归一化输入向量Xk和SOM输出层神经元的权值向量Wi:其中,Xk=[xk1,xk2,...,xkn]为第k个输入向量,n=9为输入层节点数;Wi为输出层第i个神经元的权值向量,Wi=[wi1,wi2,...,win],其中1≤i≤m;||Xk||为输入向量Xk的欧几里得范数;||Wi||为第i个神经元的权值向量的欧几里得范数;
S3、计算输入向量Xk和输出层神经元的权值向量Wi的欧氏距离,获得获胜神经元:其中,d(Xk,Wi)表示第k个输入向量和第i个神经元的权值向量的欧氏距离;使得d(Xk,Wi)取得最小值的神经元i即为输入向量Xk的获胜神经元;
S4、更新获胜神经元拓扑领域内的神经元的权值向量:Wt+1=Wt+η(t,Nt)·(Xk-Wt) (5)其中Wt为输入向量Xk的获胜神经元在t时刻的权值向量;η(t,Nt)为学习率函数,其表达式为:S5、更新学习率η和获胜神经元拓扑领域N:
学习率η的更新方式为:
ηt+1=ηt-αt (7)其中α为大于0的常数;
获胜神经元拓扑领域N的更新方式为:
Nt+1=Nt-βt (8)其中β为大于0的常数;
S6、判断SOM神经网络是否收敛:
若学习率η<ηmin或者达到最大的迭代次数T,则输出聚类结果C1并转S7;否则转S3;其中ηmin和T为用户预先设定的值;
使用DBSCAN算法对聚类结果C1的类中心进行聚类,将同类的类中心对应的类簇合并,获得聚类结果C3,具体包括以下步骤S7至S11:S7、计算SOM神经网络聚类结果C1的类中心ci:其中,Xi,Xj均为聚类结果C1的第i类簇中的元素;r为第i类簇中包含的元素个数;d(Xi,Xj)为Xi,Xj的欧氏距离;类中心ci集合用R表示;
S8、计算S7中的聚类结果C1的类中心ci集合R的K-距离集合D:对于数据集合R={c1,c2,c3,...,cm},计算元素ci到R的子集S={c1,c2,c3,...,ci-1,ci+1,...,cm}中所有元素的距离,距离按照从小到大排序,获得排序后的距离集合D′={d1,d2,d3,...,dk,dk+1,...,dm},dk即为K-距离,对集合R中每一个元素ci都计算K-距离,得到所有点的K-距离集合D={dk1,dk2,...,dkm};
S9、初始化DBSCAN算法的领域半径Eps和最小密度MinPts:MinPts的值由用户指定,其值即为S8中的K-距离的K值;领域半径Eps为S8中计算的K-距离曲线D中斜率最大的点所对应的值,若存在多个点均为斜率最大点,则取这些点的平均值作为领域半径Eps的值;
S10、使用DBSCAN算法对聚类结果C1的类中心ci集合R进行聚类:根据S8和S9所确定的DBSCAN算法的参数,对R进行聚类,获得聚类结果C2;
S11、对聚类结果C1进行并类获得聚类结果C3;
根据修正偏离元素规则对聚类结果C3进行调整,获得最终聚类结果C4,具体包括以下步骤S12至S15:S12、计算聚类结果C3的类中心c′i;
S13、计算聚类结果C3中第i类簇的平均距离Mi;
S14、计算聚类结果C3中第i类簇的偏离元素X′i;
S15、将S14中的偏离元素X′i归入其相似类中,获得电力负荷数据的最终聚类结果C4。
2.根据权利要求1所述的集成电力负荷曲线聚类方法,其特征在于,所述的步骤S11对聚类结果C1进行并类获得聚类结果C3,进一步包括:将聚类结果C2中为同一类簇的类中心ci,cj所对应聚类结果C1中的第i类簇和第j类簇的数据进行合并,获得聚类结果C3。
3.根据权利要求1所述的集成电力负荷曲线聚类方法,其特征在于,所述的步骤S12计算聚类结果C3的类中心c′i,进一步包括:其中,Xi,Xj均为聚类结果C3的第i类簇中的元素;r为第i类簇中包含的元素个数;d(Xi,Xj)为Xi,Xj的欧氏距离。
4.根据权利要求1所述的集成电力负荷曲线聚类方法,其特征在于,所述的步骤S13计算聚类结果C3中第i类簇的平均距离Mi,进一步包括:其中,Xi,Xj均为聚类结果C3的第i类簇中的元素;r为第i类簇中包含的元素个数;d(Xi,Xj)为Xi,Xj的欧氏距离。
5.根据权利要求1所述的集成电力负荷曲线聚类方法,其特征在于,所述的步骤S14计算聚类结果C3中第i类簇的偏离元素X′i,进一步包括:若C3中第i类簇中的元素Xi到类中心c′i的欧氏距离大于λ倍的平均距离,则Xi即为C3中第i类簇的一个偏离元素X′i,即:其中λ为偏离因子,为一大于1的常数;将偏离元素从该类簇中剔除出去。
6.根据权利要求1所述的集成电力负荷曲线聚类方法,其特征在于,所述的步骤S15将S14中的偏离元素X′i归入其相似类中,获得最终聚类结果C4,进一步包括:计算从第i类簇中剔除出来的偏离元素X′i与其他类簇的类中心c′j的欧氏距离,将X′i并入使得距离d(X′i,c′j)取最小值的c′j所对应的类簇中;获得最终聚类结果C4。
7.根据权利要求1所述的集成电力负荷曲线聚类方法,其特征在于,α取值为0.0002,β取值为0.0005。
8.根据权利要求1所述的集成电力负荷曲线聚类方法,其特征在于,ηmin取值为
0.000002,最大迭代次数T取值为2000。
9.根据权利要求5所述的集成电力负荷曲线聚类方法,其特征在于,λ取值为1.5。