1.基于离散多视图聚类的图像聚类方法,其特征是,包括:获取训练图像数据集;所述训练图像数据集,包括:若干个图像;对每个图像提取若干个视图特征,获得多视图特征训练数据集;
对于多视图特征训练数据集,构造基于结构化图的多视图聚类目标函数;
求解基于结构化图的多视图聚类目标函数,得到映射矩阵和连续性聚类标签矩阵;
基于连续性聚类标签矩阵构造离散化标签的目标函数,求解离散化标签的目标函数,将连续性标签转换为离散的聚类标签;
获取若干个待聚类的图像,对每个待聚类的图像提取若干个视图特征,得到待聚类图像的多视图特征数据集;
将待聚类图像的多视图特征数据集输入到映射矩阵中,得到待聚类图像的类别标签。
2.如权利要求1所述的方法,其特征是,对于多视图特征训练数据集,构造基于结构化图的多视图聚类目标函数,具体步骤包括:对每个视图特征,通过高斯核函数预先创建一个样本相似度图;
基于样本相似度图构建基于结构化图的多视图聚类目标函数,期望学习到一个结构化的图,使得结构化的图与预先创建的样本相似度图相似度最高。
3.如权利要求1所述的方法,其特征是,所述基于结构化图的多视图聚类目标函数为:其中,S∈Rn×n是学习的结构化图,sij是S的第i行第j列的元素, 是第v个视图特征的相似度图,LS=DS-(ST+S)/2是结构化图的拉普拉斯矩阵,度矩阵DS∈Rn×n被定义为一个第i个元素为∑j(sij+sji)/2的对角矩阵, 是训练图像数据集中第v个视图的特征矩阵;n是样本总数量,c是聚类个数; 是第v个视图特征的映射矩阵,P=[P1,P2,...,PV]为多个视图映射矩阵的集合;F∈Rn×c是一个连续性的标签矩阵,FT表示F的转置矩阵,Ic∈Rc×c是单位矩阵;β>0,μ>0,β和μ是平衡参数,用来平衡目标函数的多个子T项,λ是正则化参数;FF=Ic是对F的正交化约束,rank()表示矩阵的秩运算;
第v个视图特征的相似度图:
其中,样本的近邻关系通过K近邻算法KNN衡量;v=[1,2,...,V],v是视图索引,V是视图个数; 是第v个视图特征的相似度图, 为第v个视图中的第i个样本;i=[1,2,...,n],n是样本总数量, 为第v个视图中的第j个样本;j=[1,2,...,n];exp()表示以e为底的指数函数, 表示样本 之间的欧式距离;σ是一个自由参数,σ是函数的带宽参数,σ用于控制近邻数量。
4.如权利要求1所述的方法,其特征是,所述对于多视图特征训练数据集,构造基于结构化图的多视图聚类目标函数包括:S21:对于多视图特征训练数据集X=[X1,...,XV]∈Rn×D, v=[1,2,...,V],D为数据集中总的特征维度,Av∈Rn×n是V个视图特征对应的相似度图,其中,1≤v≤V,针对每个视图特征创建对应的相似度图,并将基于相似度图来学习适用于数据聚类的结构化图S,目标是学习结构化图S,并且使该结构化图与预创建的多个视图的样本相似度图保持一致性;因此,通过最小化每个视图的重建误差的线性组合来实现结构化图的创建;
对多个相似度图加权并进行线性拼接,另外对结构化图S的学习施加一个秩约束,实现结构化图S的学习;多视图数据的相似度关系表示定义为:其中,αv=1/(2||S-Av||F),v=[1,2,...,V]是学习结构化图时第v个视图的权重;
是第v个视图特征的相似度图,n是样本总数量,c是聚类个数;秩约束rank(LS)=n-c使得学习到的结构化图S具有c个连通分量;
S22:依据谱聚类算法,通过图嵌入的方法来实现在聚类过程中保留数据的流行结构,该过程表示为:minTr(FTLSF),s.t.F∈Rn×c,FTF=Ic (4)其中,Tr(·)表示求矩阵的迹的运算;LS=DS-(ST+S)/2是结构化图的拉普拉斯矩阵,度矩阵DS∈Rn×n被定义为一个第i个元素为∑j(sij+sji)/2的对角矩阵,Ic∈Rc×c为单位矩阵,F∈Rn×c是连续性的标签矩阵,FTF=Ic是对F的正交化约束;
S23:针对每一个视图特征学习一个映射矩阵,并不同的视图特征施加权重;映射矩阵的学习,通过该映射矩阵的学习解决样本外的数据聚类问题:v v v
其中,ω =1/(2||X P -F||F)是学习映射矩阵时V个视图分别对应的权重,v=[1,
2,...,V], 为正则化项,防止过拟合,λ为正则化参数,防止P出现极端解;
为Frobenius范数,简称F范数;
S24:综合步骤S21到步骤S24得到基于结构化图的多视图聚类目标函数。
5.如权利要求1所述的方法,其特征是,求解基于结构化图的多视图聚类目标函数,得到映射矩阵和连续性聚类标签矩阵;具体步骤包括:S31:固定基于结构化图的多视图聚类目标函数中的变量F和Pv,求解结构化图S,目标函数变为:αv=1/(2||S-Av||F)是学习结构化图时第v个视图的权重;LS=DS-(ST+S)/2是结构化图的拉普拉斯矩阵,度矩阵DS∈Rn×n被定义为一个第i个元素为∑j(sij+sji)/2的对角矩阵,Ic∈Rc×c为单位矩阵,F∈Rn×c是连续性的标签矩阵,FTF=Ic是对F的正交化约束;β>0为平衡结构化图学习和图嵌入两项的平衡参数;
转化为:
v v
α=1/(2||S-A ||F),v=[1,2,...,V]是学习结构化图时第v个视图的权重;sij,分别为矩阵S,Av的第i行第j列的元素,fi为连续标签矩阵F的第i行向量,fj为连续标签矩阵F的第j行向量,fi分别表示第i个样本的连续标签;fj分别表示第j个样本的连续标签;β>0为平衡参数;
公式(7)对于每一个i是独立的,因此分别对每个i求解:为了简便,定义 oi为第j个元素为oij的向量;
公式(8)转换为向量形式:
其中, oi为第j个元素为oij的向量;
公式(9)通过一个迭代算法求解得出结构化图S向量形式si的解;
S32:固定目标函数中的变量S,求解每个视图特征的映射矩阵Pv和聚类连续性标签矩阵F;目标函数变为:其中,ωv=1/(2||XvPv-F||F),v=[1,2,...,V]是学习映射矩阵时V个视图对应的权重,λ是正则化参数;
将公式(10)看作v个子问题来求解,每个子问题对应一个视图:将公式(11)对Pv求导并令其等于0,得到Pv的解:
其中,ωv=1/(2||XvPv-F||F),v=[1,2,...,V]是学习映射矩阵时V个视图对应的权重,为单位矩阵;
根据Pv的解,对F求解,得:
其中, 是中心化矩阵,1表示一个所有元素都为1的列向量,In是维度为n×n的单位矩阵; 是临时替代变量,μ>0是平衡参数,公式(13)中F最终的解通过对LS+μHn-μM进行特征值分解得到。
6.如权利要求1所述的方法,其特征是,基于连续性聚类标签矩阵构造离散化标签的目标函数,具体步骤包括:其中,Q∈Rc×c是将连续标签旋转到离散标签的旋转矩阵,QTQ=Ic为对旋转矩阵Q的正交约束;Y是最终的离散标签,Y∈Idx表示每个样本的聚类标签向量yi∈{0,1}c×1仅包含一个等于1的元素,每个元素对应的簇就是当前样本所聚类的簇。
7.如权利要求1所述的方法,其特征是,求解离散化标签的目标函数,将连续性标签转换为离散的聚类标签;具体步骤包括:固定离散化标签的目标函数中的变量Y,求解旋转矩阵Q;
公式(15)一个正交普氏问题,求解可得到旋转矩阵Q的解;
固定目标函数中的旋转矩阵Q,求解离散标签Y;
目标函数转化为:
n×c
其中,W∈R =FQ是一个临时替代变量;Y∈Idx为离散标签矩阵,其元素仅包含0和1;
则Y的解为:
其中,Yij为离散标签矩阵Y的第i行第j列元素,同样地,Wik为替代变量W的第i行第k列元素,argmax表示计算使得后面式子达到最大值时的变量的取值。
8.基于离散多视图聚类的图像聚类系统,其特征是,包括:训练视图特征提取模块,其被配置为获取训练图像数据集;所述训练图像数据集,包括:若干个图像;对每个图像提取若干个视图特征,获得多视图特征训练数据集;
目标函数构造模块,其被配置为对于多视图特征训练数据集,构造基于结构化图的多视图聚类目标函数;
求解模块,其被配置为求解基于结构化图的多视图聚类目标函数,得到映射矩阵和连续性聚类标签矩阵;
聚类标签获取模块,其被配置为基于连续性聚类标签矩阵构造离散化标签的目标函数,求解离散化标签的目标函数,将连续性标签转换为离散的聚类标签;
待聚类视图特征提取模块,其被配置为获取若干个待聚类的图像,对每个待聚类的图像提取若干个视图特征,得到待聚类图像的多视图特征数据集;
待聚类图像标签获取模块,其被配置为将待聚类图像的多视图特征数据集输入到映射矩阵中,得到待聚类图像的类别标签。
9.一种电子设备,其特征是,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成权利要求1-7任一项方法所述的步骤。
10.一种计算机可读存储介质,其特征是,用于存储计算机指令,所述计算机指令被处理器执行时,完成权利要求1-7任一项方法所述的步骤。