欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2015106905007
申请人: 广西师范大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2023-12-11
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.医疗数据发布的差分隐私保护方法,其特征是,包括如下步骤:

步骤1、通过数据预处理,得到所有属性的属性值均泛化到最高的属性值组合数据表和属性状态层次树;

步骤2、用户设定最大分裂次数h和匿名隐私保护参数k;

步骤3、将预处理得到的属性值组合数据表的属性值加入到被泛化属性值集合中,并利用每个属性的状态层次树来统计每个被泛化属性值的信息增益;

步骤4、从被泛化的属性值集合中选取待分裂的被泛化的属性值,并对被选出的被泛化的属性值进行分裂;

步骤5、对分裂后得到的新的属性值组合进行k-匿名验证;即

如果每个新得到的属性值组合均满足k-匿名要求,即该属性值组合的计数大于匿名隐私保护参数k,表明此次分裂成功,则重新计算信息增益,并且实际分裂次数n增加1;

如果其中有一个新得到的属性值组合不满足k-匿名要求,即该属性值组合的计数小于等于匿名隐私保护参数k,表明此次分裂失败,则将选中的待分裂属性值从被泛化的属性值集合中删除;

步骤6、重复步骤4-5的分裂过程,直到没有能继续分裂的被泛化的属性值或者分裂次数等于最大分裂次数h;

步骤7、完成分裂过程后,对得到的满足k-匿名的属性值组合数据表中每个属性值组合的计数进行差分隐私加噪处理,得到含有噪声的属性值组合;

步骤8、根据含有噪声的属性值组合数据表进行数据重构,最后将重构得到满足差分隐私和k-匿名的匿名数据集,并将之发布。

2.根据权利要求1所述的医疗数据发布的差分隐私保护方法,其特征是,步骤4中,仅在检测被泛化的属性值集合中被泛化的属性值个数m>0且实际分裂次数n<最大分裂次数h时,才从被泛化的属性值集合中选取待分裂的被泛化的属性值,并对被选出的被泛化的属性值进行分裂;而在属性值个数m≤0或实际分裂次数n≥最大分裂次数h时,则跳转到步骤

8。

3.根据权利要求1所述的医疗数据发布的差分隐私保护方法,其特征是,步骤4中,被泛化的属性值的选取过程如下:首先,产生一个范围在[0,1]内的随机数R;

其次,在被泛化的属性值集合中,按照下述概率公式从第一个被泛化的属性值开始计算,如果生成的随机数 则将该被泛化的属性值作为待分裂的属性值;如果则表示该被泛化的属性值不能作为本次分裂的属性值,则重新产生一个随机数R,并选取被泛化的属性值集合M中的下一个被泛化的属性值进行评估,直到找到第一个满足 的被泛化的属性值作为待分裂的属性值;其中概率公式为:式中,ε为设定的差分隐私保护参数,DA为所有属性的个数,DN为数值型属性的个数,h为最大分裂次数,Score(Rv)代表信息增益,j为当前需要评估的被泛化的属性值Rv在被泛化的属性值集合M中的序号。

4.根据权利要求1所述的医疗数据发布的差分隐私保护方法,其特征是,步骤7中,根据下述拉普拉斯公式对属性值组合数据表加入统计噪声:式中,Lap()是一个函数称之为拉普拉斯函数,ε为差分隐私保护参数,|DA|则分别代表所有属性的个数。