1.基于直觉模糊C均值的汽车数据聚类方法,其特征是,包括:输入设定参数和汽车数据集特征值矩阵;
利用改进的直觉模糊熵,对汽车数据集特征值矩阵进行加权计算,获得加权后的特征值矩阵;
定义密度参数,确定初始聚类中心;
判断迭代次数是否小于设定迭代阈值,如果是,则进入隶属度矩阵计算步骤,否则进入输出步骤;
隶属度矩阵计算步骤:计算隶属度矩阵;
利用隶属度矩阵更新聚类中心;
判断上一时刻数据集对于聚类中心的欧氏距离平方和,与当前时刻数据集对于聚类中心的欧氏距离平方和的差值是否小于设定阈值;如果是,则进入输出步骤,如果否,则返回隶属度矩阵计算步骤;
输出步骤:输出隶属度矩阵和聚类中心,根据最大隶属度原则求得汽车数据聚类结果。
2.如权利要求1所述的方法,其特征是,所述设定参数,包括:聚类数目c、模糊度参数m、停止迭代的阈值ε和迭代次数t;所述汽车数据集特征值矩阵G,包括:每一款汽车的油耗、汽车轮胎的摩擦系数、汽车的价格、汽车的舒适度和汽车的安全系数。
3.如权利要求1所述的方法,其特征是,所述利用改进的直觉模糊熵,对汽车数据集特征值矩阵G进行加权计算,获得加权后的特征值矩阵,具体步骤为:设汽车集合X={x1,x2,…xn},A={
计算加权后的特征值矩阵G′:
g′ij=ωjgij=<1-(1-μij)ωj,(vij)ωj>;
其中,加权后的特征值矩阵G′=(g′ij)n×s;gij是矩阵的特征值,μij是隶属度,vij是聚类中心。
4.如权利要求1所述的方法,其特征是,所述定义密度函数,确定初始聚类中心;具体步骤包括:令t=0,确定初始聚类中心V(t);
计算特征矢量Gi′所处区域的密度,定义区域密度参数ρi,以Gi′为中心,计算n个欧氏距离d(Gi′,G1′),d(Gi′,G2′),…,d(Gi′,Gn′)并将它们重新排序,令d(Gi′,G1′)≤d(Gi′,G2′)≤…≤d(Gi′,Gn′)其中,d(Gi′,G1′)是第一个区域G1′与特征矢量Gi′所处区域的欧式距离度量;d(Gi′,G2′)是第二个区域G2′与特征矢量Gi′所处区域的欧式距离度量;d(Gi′,Gn′)是第n个区域Gn′与特征矢量Gi′所处区域的欧式距离度量;
由于d(Gi′,Gi′)为0,所以重新排序后,将包含Gi′在内的N个特征矢量的最小欧氏距离,记为R(Gi′);
R(Gi′)=d(Gi′,G′(N))
其中,Gi′是所处区域密度的特征矢量;G′(N)是Gi′所处区域的第N个特征矢量;0
Gi′所处的区域G′(1),G′(2),…,G′(N)共N个特征矢量,Gi′的区域密度参数ρi为其中,R(Gi′)是包含Gi′在内的N个特征矢量的最小欧氏距离;
利用R(Gi′)和ρi的公式计算特征矢量的区域密度参数,比较后选出区域密度最大的Gi′作为第一个聚类中心V1,得到一个高密度区域的特征矢量集合P={G′(1),G′(2),…,G′(N)},在P中取得距离V1最远的特征矢量作为第二个聚类中心V2,再计算P中所有特征矢量到V1的距离,再计算P中所有特征矢量到V2的距离,由P得到满足以下条件的第三个聚类中心V3:max(min(d(G′(r),V1),d(G′(r),V2))),r=1,2,…,N即取距离第一个聚类中心V1和第二个聚类中心V2距离均最远的特征矢量作为第三个聚类中心;
最后,计算P中所有特征矢量到V1,V2,…,Vk-1的距离,在P中取出满足max(min(d(G′(r),V1),d(G′(r),V2),…,d(G′(r),Vk-1))),r=1,2,…,N的特征矢量,作为第k个聚类中心Vk(k=1,2,…,c),依次求得聚类中心集合V={V1,V2,…,Vc}。
5.如权利要求1所述的方法,其特征是,所述隶属度矩阵计算步骤具体步骤包括:计算隶属度矩阵U(t),U(t)=(uik)c×l;
当1≤l≤c,令d(G′i,Vl)=0,则
当对任意l=1,2,…,c,都有d(G′i,Vl)>0;
m为模糊度参数;
其中:uik为样本属于聚类中心的程度;u为uik构成的隶属度矩阵;d为模糊度矩阵;G为样本方差;V是k个聚类中心构成的聚类中心矩阵;d(G′i,Vl)是特征矢量G′和聚类中心Vl之间的欧氏距离,G′是特征值矩阵,Vl是第l个聚类中心。
6.如权利要求1所述的方法,其特征是,利用隶属度矩阵更新聚类中心具体步骤包括:利用隶属度矩阵更新聚类中心V(t),其中第k个聚类中心记为Vk;
Vk={vk1,vk2,…,vks}
式中,vkj=<αkj,βkj>,
其中,vks是特征值矩阵中的特征值向量,αkj和βkj均为聚类中心的直觉模糊数,uik是隶属度矩阵,μij是ui相当于vj的隶属度,vij是ui相当于vj的聚类中心,m为模糊度参数。
7.如权利要求1所述的方法,其特征是,所述判断上一时刻数据集对于聚类中心的欧氏距离平方和,与当前时刻数据集对于聚类中心的欧氏距离平方和的差值是否小于设定阈值具体步骤包括:数据集对于聚类中心的欧氏距离平方和为 判断J(U
(t-1),V(t-1))-J(U(t),V(t))<ε是否成立,成立进入输出步骤,否则跳转到隶属度矩阵计算步骤;
其中,U(t-1)是迭代次数为t-1时的隶属度,V(t-1)是隶属度为U(t-1)时的聚类中心,U(t)是(t) (t)迭代次数为t时的隶属度,V 是隶属度为U 时的聚类中心,d(Gi′,Vk)是特征矢量Gi′和聚类中心Vk之间的欧氏距离,G′是特征值矩阵,Vl是第l个聚类中心,ε是迭代阈值。
8.基于直觉模糊C均值的汽车数据聚类系统,其特征是,包括:输入模块,其被配置为:输入设定参数和汽车数据集特征值矩阵;
加权模块,其被配置为:利用改进的直觉模糊熵,对汽车数据集特征值矩阵进行加权计算,获得加权后的特征值矩阵;
初始聚类中心确定模块,其被配置为:定义密度参数,确定初始聚类中心;
第一判断模块,其被配置为:判断迭代次数是否小于设定迭代阈值,如果是,则进入隶属度矩阵计算模块,否则进入输出模块;
隶属度矩阵计算模块,其被配置为:计算隶属度矩阵;
更新模块,其被配置为:利用隶属度矩阵更新聚类中心;
第二判断模块,其被配置为:判断上一时刻数据集对于聚类中心的欧氏距离平方和,与当前时刻数据集对于聚类中心的欧氏距离平方和的差值是否小于设定阈值;如果是,则进入输出模块,如果否,则返回隶属度矩阵计算模块;
输出模块,其被配置为:输出隶属度矩阵和聚类中心,根据最大隶属度原则求得汽车数据聚类结果。
9.一种电子设备,其特征是,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成权利要求1-7任一项方法所述的步骤。
10.一种计算机可读存储介质,其特征是,用于存储计算机指令,所述计算机指令被处理器执行时,完成权利要求1-7任一项方法所述的步骤。