1.融合已知相别和地址信息的低压用户计量表箱识别方法,其特征在于:该方法具体包括以下步骤:步骤一、准备已知数据;
s1.1、采集用户电压数据:
设定配电变压器低压三相四线出线为M条,台区共有MD个分线箱作为线路的主要分叉节点;通过智能电表采集配置后确定台区内单相用户与三相用户的数量分别为n1和n2,则等效单相计量用户是数量n为:n=n1+3n2 (1)
收集T次电压历史数据U∈Rn*T:
其中,un,t为第n个等效用户第t次的电压数据;在已知相别的情况下,将T次的电压历史数据按照相别区分为 其中nA、nB、nC为按相区分的等效单相用户数量;
s1.2、采集用户地址信息;
步骤二、分线箱聚类数评估;
分别针对分相后的电压数据UA、UB、UC进行聚类,得到的分线箱聚类数为Md,d∈A、B、C,为了使聚类簇之间的边界清晰以充分利用数据特征,要求Md满足:k≥Md≥MD (3)
其中,k表示d相下属的等效单相计量箱个数,由用户地址信息中的单元号确定;分线箱聚类数Md的值经过评估后确定,评估方法为:s2.1、利用公式(3)确定Md的上下限,Md∈[MD,k]且Md为整数;
s2.2、对Md的每一个取值计算其对应聚类结果的轮廓系数s(j):s(j)=(b(j)-a(j))/max{a(j),b(j)} (4)其中a(j)和b(j)分别表示凝聚度和分离度,计算公式为:其中y是指离样本j最近的中心点cy,Cy是指最接近中心点cy的所有样本的集合,ky是最接近中心点cy的簇内所有的样本的数量;而z是指除y以外的中心点,kz则是除y以外的中心点簇内的样本数量,di,j表示欧氏距离;
s2.3、求s(j)的平均值:
s2.4、比较计算得到的每个整数Md值的SC值,选取令SC值最接近1的Md值作为分线箱聚类数;
步骤三、初步聚类;
将步骤二中评估得到的分线箱聚类数Md作为聚类数,对分相后的电压数据UA、UB、UC进行初步聚类,得到各相电压数据在分线箱层面的分类结果,其分类数量为各相的Md值;
步骤四、获取表箱聚类数并构建约束;
s4.1、依据用户地址信息中的单元号确定步骤三中第l簇下属的等效单相计量箱个数,即表箱聚类数,设为Ml;
s4.2、依据用户地址信息中的上下邻里关系构建聚类过程中的约束关系,确保处于同一约束内的用户在聚类过程中始终处于同一簇内;
步骤五、表箱聚类;
利用约束的k-medoids聚类算法,结合步骤四得到的表箱聚类数Ml和构建的约束关系对步骤三得到的每一个簇再次进行聚类;
约束的k-medoids聚类算法的迭代过程为:s5.1、在样本空间中选择Ml个初值作为中心点;
s5.2、将每一个约束中的所有样本作为子集,没有参与约束的每个样本点都单独作为一个子集;
s5.3、通过公式(8)计算每个样本行向量Ue到每个中心点cf的距离def,并将距离def按子集为单位各自取平均,再将每个子集都分配给最近的一个中心点;
其中,t表示时间片段,t∈[1,T],T为用户电压数据的测量总次数;cf,t是聚类中心点序列的第t个元素;ue,t是样本行向量Ue的第t个元素;
s5.4、在每个聚类簇中依次检查将除中心点以外的样本作为新的中心点是否可以让簇内距离的总和减少,如果可以,则该样本作为新的中心点;
s5.5、若中心点发生变化,重复步骤5.3与步骤5.4;若中心点不变,则输出聚类结果;
步骤六、分类与标识;
相同电压的总节点数量为:
K即为电压波形的最终分类个数;完成分类后利用收集到的用户地址信息,为最终分类簇标记地址信息,即完成表箱的分类。
2.如权利要求1所述融合已知相别和地址信息的低压用户计量表箱识别方法,其特征在于:步骤1.2采集用户地址信息的具体方法为:首先提取用户地址信息,将地址信息转换为Unicode码,确定用户的楼号、单元号以及门牌号;然后根据提取到用户地址信息,对漏填的用户信息进行补全。
3.如权利要求1所述融合已知相别和地址信息的低压用户计量表箱识别方法,其特征在于:步骤5.1所述Ml个初值的选择方法为:s5.1.1、在样本空间中随机选取一个样本作为一个初值并记录;
s5.1.2、若被选中的样本在某个约束中,则将此约束中的所有样本排除出样本空间;否则仅排除此样本;
s5.1.3、重复Ml次步骤5.1.1和步骤5.1.2,得到Ml个初值。