1.多图数据中频繁子图挖掘的差分隐私保护方法,其特征是,包括步骤如下:步骤1、统计多图中每对顶点之间所包含的边关系类型,以得到每对顶点的多图子多边集;
步骤2、根据边关系类型的数量对步骤1所得到的多图子多边集进行分类统计,得到所有多图子多边集中最大边关系类型数量n;
步骤3、基于给定最大边关系限制数量Lmax,对步骤2所得到的所有多图子多边集进行噪音频繁挖掘后,得到频繁种子集合;
步骤3.1、对所有的边关系类型利用向下闭包性质,得到具有不同边关系类型数量j的多边集合即候选子多边集Cj;
步骤3.2、基于每个候选子多边集Cj,对所有多图子多边集中,边关系类型数量大于最大边关系限制数量Lmax的多图子多边集进行智能截断操作,得到每个候选子多边集Cj对应的截断多边集E'j;
步骤3.3、计算每个候选子多边集Cj中的每个元素在对应的截断多边集E'j中的支持度,并对其添加拉普拉斯噪音后,将噪音支持度大于等于设定阈值δ的元素加入到频繁种子集合中;
步骤4、对步骤3所得到的频繁种子集合进行深度优先遍历来扩展搜索空间,得到具有不同顶点对数i的子图集合即候选子图集Graphi;
步骤5、分别计算步骤4所得到的各个候选子图集的最大支持度,并将其中最大支持度大于等于设定阈值δ的候选子图集作为筛选候选子图集;
步骤6、对于步骤5所得到的每个筛选候选子图集,分别计算该筛选候选子图集中的各个子图的支持度:若子图的支持度大于等于设定阈值δ,则该子图为频繁子图;否则,该子图为不频繁子图;
步骤7、对步骤6所选出的所有频繁子图进行差分隐私保护后,输出差分隐私保护后的频繁子图及其支持度;
上述i=1,2,…,m,m为多图中顶点对数,j=1,2,…,n,n为最大边关系类型数量。
2.根据权利要求1所述多图数据中频繁子图挖掘的差分隐私保护方法,其特征是,步骤
3中,最大边关系限制数量Lmax人为给定,或根据以下方法确定:首先,计算满足式(1)的最小的待求边关系类型数量n’,其中,n为所有子多边集中最大的边关系类型数量,n’为待求边关系类型数量,zj表示具有j种边关系类型的子多边集的数量,zj∈z,z为边关系数量集,η为设定的权值;
接着,将所求得的最小的待求边关系类型数量n’和所有子多边集中最大边关系类型数量n中的较小值,作为最大边关系限制数量Lmax。
3.根据权利要求1所述多图数据中频繁子图挖掘的差分隐私保护方法,其特征是,步骤
3.2的具体过程如下;
步骤3.2.1、如果候选子多边集Cj中的元素存在于当前多图子多边集中,则将该元素添加到暂存集C'j中;
步骤3.2.2、根据暂存集C'j中各个元素在该暂存集C'j中的支持度,给定各个元素的初始权重,其中初始权重与支持度呈正比关系;
步骤3.2.3、从暂存集C'j中挑选出当前最高权重的元素,并将该元素加入到截断多边集E'j中,同时从暂存集C'j中删除该元素;
步骤3.2.4、根据下公式更新暂存集C'j中各个元素的权重,即W'h=Wh+αh*β
其中,W'h为元素h更新后的权重,Wh为元素h更新前的权重,αh为元素h中所含项的平均权重, H为元素h所含的项数,β为截断多边集E'j中的元素数量;
步骤3.2.5、若截断多边集E'j中元素的所有边关系类型数量未达到最大边关系限制数量Lmax,则返回步骤3.2.3;否则,则当前多图子多边集的智能截断操作结束;
步骤3.2.6、对所有多图子多边集中,边关系类型数量大于最大边关系限制数量Lmax的多图子多边集均进行步骤3.2.1-3.2.5的智能截断操作后,得到每个候选子多边集Cj对应的截断多边集E'j;
上述j=1,2,…,n,n为最大边关系类型数量。
4.根据权利要求3所述多图数据中频繁子图挖掘的差分隐私保护方法,其特征是,步骤
3.2.6之后,还进一步包括步骤如下:
步骤3.2.7、对频繁种子集合中的元素按照支持度从小到大的顺序排列。