1.一种关联元组数据的差分隐私发布方法,其特征在于:包括以下步骤,步骤S1,输入数据及参数初始化;
步骤S2,生成初始化噪声并扰动初始查询结果;
步骤S3,根据新的查询函数生成满足特定自协方差矩阵的噪声并扰动查询结果;
步骤S4,生成符合特定自协方差矩阵的拉普拉斯噪声变量;
步骤S5,更新拉普拉斯噪声变量;
步骤S6,迭代处理所有查询直至查询函数序列处理结束。
2.根据权利要求1所述一种关联元组数据的差分隐私发布方法,其特征在于,所述步骤S1包括以下子步骤:
步骤S1‑1,对原始数据集进行数据清洗和归约,得到待保护关联元组数据集X={X1,X2,L,Xn};
步骤S1‑2,读入待查询结果序列Q={Q1,Q2,L,Qn};
步骤S1‑3,根据待保护关联元组数据集X和查询序列Q设置敏感度函数Δf:Δf=sup||Q(Xk)‑Q(Xu)||1其中Xk、Xu是X中被查询的任意两个元组,Xk∈X,Xu∈X。根据用户个人隐私保护需求初始化隐私预算参数ε。
3.根据权利要求1所述一种关联元组数据的差分隐私发布方法,其特征在于,所述步骤S3包括以下子步骤:
步骤S3‑1,判断新的查询函数Q2是否与上次的查询函数相同,若Q2≠Q1,跳转到步骤S4得到拉普拉斯噪声变量y2;若Q2=Q2,则跳转到步骤S5得到拉普拉斯噪声变量y′2;
步骤S3‑2,若Q2≠Q1,计算加扰查询结果Q′2=Q2+y2;若Q2=Q2,计算加扰查询结果Q′2=Q2+y′2。
4.根据权利要求1所述一种关联元组数据的差分隐私发布方法,其特征在于,所述步骤S4包括以下子步骤:
步骤S4‑1,计算Xk、Xu的自协方差矩阵Ck,u,生成均值为零、协方差矩阵等于自协方差矩阵Ck,u的高斯变量Gk,u;
步骤S4‑2,生成概率密度函数为 的指数变量W;
步骤S4‑3,将高斯变量和指数变量相乘得到广义拉普拉斯变量
5.根据权利要求1所述一种关联元组数据的差分隐私发布方法,其特征在于,所述步骤S5包括以下子步骤:
步骤S5‑1,生成概率密度函数为 的新的指数变量W′;
步骤S5‑2,将高斯变量和指数变量相乘得到新的广义拉普拉斯变量
6.一种关联元组数据的差分隐私发布系统,其特征在于:包括以下模块,输入及参数初始化模块,用于输入数据及初始化参数,包括以下子单元:第一单元,对原始数据集进行数据清洗和归约,得到待保护关联元组数据集X={X1,X2,L,Xn};
第二单元,读入待查询结果序列Q={Q1,Q2,L,Qn};
第三单元,根据待保护关联元组数据集X和查询序列Q设置敏感度函数Δf:Δf=sup||Q(Xk)‑Q(Xu)||1其中,Xk、Xu是X中被查询的任意两个元组,Xk∈X,Xu∈X。然后根据用户个人隐私保护需求初始化隐私预算参数ε。
初始化噪声扰动模块,用于生成初始化噪声并扰动初始查询结果,包括以下子单元:第一单元,令t=1,根据拉普拉斯分布概率密度函数 初始化生成拉普拉斯噪声;
第二单元,扰动初始化查询结果Q′1=Q1+y1;
特定自协方差矩阵拉普拉斯噪声生成模块,用于根据新的查询函数来生成满足特定自协方差矩阵的噪声并扰动查询结果,包括以下子单元:第一单元,判断新的查询函数Q2是否与上次的查询函数相同,若Q2≠Q1,跳转到第三单元得到拉普拉斯噪声变量y2;若Q2=Q2,跳转到拉普拉斯噪声更新模块得到拉普拉斯噪声变量y′2;
第二单元,若Q2≠Q1,计算加扰查询结果Q′2=Q2+y2;若Q2=Q2,计算加扰查询结果Q′2=Q2+y′2;
第三单元,生成符合特定自协方差矩阵的拉普拉斯噪声变量,首先,计算Xk、Xu的自协方差矩阵Ck,u,生成均值为零、协方差矩阵等于自协方差矩阵Ck,u的高斯变量Gk,u;然后生成概率密度函数为 的指数变量W;最后将高斯变量和指数变量相乘得到广义拉普拉斯变量
拉普拉斯噪声更新模块,用于更新拉普拉斯噪声变量,包括以下子单元第一单元,生成概率密度函数为 的新的指数变量W′;
第二单元,将高斯变量和指数变量相乘得到新的广义拉普拉斯变量迭代处理模块,用于迭代处理所有查询直至查询函数序列处理结束,包括以下子单元:第一单元,令t=2,3,L n,依次按照特定协方差矩阵拉普拉斯噪声生成模块和拉普拉斯噪声更新模块生成噪声变量并扰动对应的查询结果,得到扰动后的查询结果Q′2,L,Q′n;
第二单元,输出并发布扰动查询结果序列Q′={Q′1,Q′2,L,Q′n}。