欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2020100105403
申请人: 广西师范大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-05-09
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.亲和传播聚类的差分隐私保护方法,其特征是,包括步骤如下:

步骤1、计算原始数据集中每两个不同样本数据之间的距离,以得到每两个不同样本数据之间的相似度,并据此构建出非完整的相似度矩阵S′;

步骤2、对步骤1的非完整的相似度矩阵S′中的对角相似度进行补全,由此得到完整的相似度矩阵S;即:步骤2.1、分别计算原始数据集中的每个样本数据的密度值,并根据密度值对原始数据集中的样本数据进行降序排序;

步骤2.2、将密度值排在前θ%的样本数据作为第一类样本数据,其余的样本数据作为第二类样本数据;

步骤2.3、将非完整的相似度矩阵S′中所有相似度的最大值作为第一类样本数据的相似度,并将非完整的相似度矩阵S′中所有相似度的平均值作为第二类样本数据的相似度;

步骤2.4、基于步骤2.3所得到的每个样本数据的相似度,对步骤1的非完整的相似度矩阵S′的对角相似度进行补全,由此得到完整的相似度矩阵S;

步骤3、初始化吸引度矩阵R′和归属度矩阵A′,其中吸引度矩阵R′的吸引度初值为全0,归属度矩阵A′的归属度初值为全0;

步骤4、先设定最大迭代次数X和扰动概率参数f;再基于最大迭代次数X,构建一个长度为X的全0的初始比特串B′;后基于扰动概率参数f,对初始比特串B′进行PRR机制扰动,得到扰动比特串B;

步骤5、基于步骤2的相似度矩阵S和步骤4的扰动比特串B,对步骤3的吸引度矩阵R′和归属度矩阵A′进行X次迭代,得到吸引度矩阵R和归属度矩阵A;即:步骤5.1、先基于相似度矩阵S和归属度矩阵A′,利用吸引度计算公式计算初始的吸引度矩阵R0;再基于初始的吸引度矩阵R0,利用归属度计算公式计算初始的归属度矩阵A0;

步骤5.2、在第1次迭代时,先基于相似度矩阵S和上一次迭代的归属度矩阵A0,利用吸引度计算公式计算当前吸引度矩阵R1;再基于当前吸引度矩阵R1,利用归属度计算公式计算归属度矩阵A1;

步骤5.3、在第x次迭代时,先基于相似度矩阵S和上一次迭代的归属度矩阵Ax-1,利用吸引度计算公式计算当前吸引度矩阵Rx;再判断扰动比特串B中的第x位是否为1:如果第x位为1,则先对当前吸引度矩阵Rx进行拉普拉斯加噪,得到当加噪后的吸引度矩阵Rx′,再基于当加噪后的吸引度矩阵Rx′,并利用归属度计算公式计算当归属度矩阵Ax;如果第x位为0,则直接基于当吸引度矩阵Rx,并利用归属度计算公式计算当归属度矩阵Ax;

步骤5.4、重复步骤5.3的过程,得到最终的吸引度矩阵RX和最终的归属度矩阵AX,此时吸引度矩阵RX即为所求吸引度矩阵R,归属度矩阵AX即为所求归属度矩阵A;

步骤6、对于原始数据集的第i个样本数据将步骤5所得吸引度矩阵R第i行第i列的吸引度值与步骤5所得归属度矩阵A的第i行第i列的归属度值进行相加,如果相加所得的值大于

0,则将该样本数据视为聚类中心点;否则,将该样本数据视为普通聚类点;

步骤7、对于每个普通聚类点,先基于吸引度矩阵R和归属度矩阵A,计算该普通聚类点与各个聚类中心点的亲和度值,其中亲和度值等于普通聚类点与聚类中心点的吸引度值与归属度值之和,再将普通聚类点分配给亲和度值最大的聚类中心点所在的簇中,由此完成聚类;

步骤8、将步骤7所得到的聚类输出;

上述θ%为设定值;i=1,2,...,N,N为原始数据集的样本数据个数;x=1,2,...,X,X为迭代次数。

2.根据权利要求1所述的亲和传播聚类的差分隐私保护方法,其特征是,所有相似度矩阵、所有吸引度矩阵和所有归属度矩阵的大小为N×N,其中N为原始数据集的样本数据个数。

3.根据权利要求1所述的亲和传播聚类的差分隐私保护方法,其特征是,步骤2中,θ%的取值为5%~10%之间。

4.根据权利要求1所述的亲和传播聚类的差分隐私保护方法,其特征是,样本数据 与样本数据 在当前迭代的吸引度 为:式中, 表示样本数据 与样本数据 的距离, 表示表示样本数据

与样本数据 的距离, 表示样本数据 与样本数据 在上一次迭代的

归属度,i,k,k′=1,2,...,N,N为原始数据集的样本数据个数。

5.根据权利要求1所述的亲和传播聚类的差分隐私保护方法,其特征是,样本数据 与样本数据 在当前迭代的归属度 为:式中, 表示样本数据 与样本数据 在上一次迭代的吸引度;

表示样本数据 与样本数据 在上一次迭代的吸引度,i,k,k′=1,

2,...,N,N为原始数据集的样本数据个数。