1.一种凸规划聚类水污染溯源方法,其特征在于,包括以下步骤:S1,基于Siamese网络的邻近点相似度描述样本;步骤S1具体为:定义一组样本对(x1,x2),作为Siamese网络的输入值,样本对标签为y;当样本对属于相同类别时,样本对标签y=1;反之,样本对标签y=0;
针对两个输入x1和x2,网络低维空间的相似度输出结果分别为GW(x1)和GW(x2),Siamese网络的相似度损失函数定义为:L(W;x1,x2,y)=yL1(W;x1,x2)+(1‑y)L2(W;x1,x2)
2 2
式中L1(W;x1,x2)=||GW(x1)‑GW(x2)|| ,L2(W;x1,x2)=max(c‑||GW(x1)‑GW(x2)|| ,0);W为Siamese网络参数,常数c定义为相似度的最大值S2,利用所述邻近点相似度抽取水污染溯源特征;步骤S2具体包括:S21,定义溯源特征变换网络的损失函数为:式中θ表示变换网络y=Fθ(x)的参数,w(xi,xj)是由Siamese网络输入xi和xj计算得到的相似度;
d
S22,抽取m个样本x1,...,xm∈R ,构成一个m×d的矩阵X,设对应的溯源特征为一个m×k的矩阵Y,正交化约束描述为:其中Ik×k是一个k阶单位阵;
正交化层表示为 其中L从 的Cholesky分解中获得, 用来满足正交化约束;
S23,进行网络训练过程,具体包括前向计算过程和反向计算过程;
所述前向计算过程为:
随机选择m个数据构成数据批X;
前向网络计算,得到网络归一化层输入计算Cholesky分解
设置网络归一化层权系数为 并计算输出所述反向计算过程为:
利用Siamese网络计算输入数据对的相似度;
计算溯源特征变换网络的损失函数;
反向传播,更新除归一化层之外的全部网络参数;
S3,将所述水污染溯源特征结合监测网络节点的地理分布信息,构造图模型;将水污染溯源等价于所述图模型的全局优化分割,将所述图模型的全局优化分割转换为最小传导率;步骤S3的具体为:
利用所述溯源特征结合监测网络节点的地理分布信息,构造一个图模型G=(V,E),其中节点集V对应监测网络节点,边沿集E由相邻节点(vi,vj)和连接权值wi,j集合构成,wi,j的定义为:
wi,j=||Yi‑Yj||2其中节点i和节点j在地理邻域范围之内;
根据所述图模型G,将水污染的溯源等效于图模型的全局优化分割,设节点集S是图模型节点集V的一个子集,定义节点集S的传导率为:其中 V\S表示集合S在集合V上的补集;
将图模型的全局优化分割转换为最小传导率,表示为:其中k是分割区域数,S1S2∪…∪Sk=V;
S4,最大化特征基内接椭球体的凸规划,求解所述最小传导率。
2.如权利要求1所述的方法,其特征在于:步骤4具体计算过程为:S41,将溯源特征的基分为多个类别,每个类别的代表基表示为:min[‑logdetX]T
满足条件:pXp≤1,X>0,正定,任意p∈S,其中S==[p1,p2,…pn];
k
S42,计算拉普拉斯矩阵L最小k个特征值对应的特征矢量f1,f2,…,fk,构造矩阵P∈R×n T
,P=[f1,f2,…,fk],矩阵P的列向量表示为p1,p2,…pn;
S43,确定矩阵P列向量p1,p2,…pn以原点为中心的最小封闭区域H(S),根据最小封闭区域边界上的列向量点构造分类指示标记集I=[i1,i2,…,ik],其中i1表示 属于节点集T1,i2表示 属于节点集T2;
S44,归一化处理 初始化节点分类集{T1,T2,…,Tk}为空集,根据分类指示标记集I=[i1,i2,…,ik],计算:a)选择 计算 确定极大值对应列向量pj;
b)更新
输出节点分类集{T1,T2,…,Tk}。
3.根据权利要求2所述的方法,其特征在于:步骤S43中,如果边界上的列向量点大于k个,使用连续投影算法选择k个在k‑1维子空间上投影范数最小的边界上的列向量点。