欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 202010235033X
申请人: 九江学院
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2023-12-11
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于排序分类的个性化推荐中的隐私保护方法,其特征在于,该方法包括以下步骤:a、用户数据建模:在形式上,用U表示用户集,I表示用户项目集即单个用户数据的数量,用D表示所有的用户数据,用Y表示所有的用户隐私数据; 则用户u的数据集合表示为Du,大小为|I|,Yu表示用户u的一种隐私数据,每个用户具有相同的数据量;在用户数据集合里可以展现这个用户对一些活动项目的喜爱程度,用du表示用户u的某个数据;用户订阅第三方推荐服务时,服务提供者将立即访问用户的数据集Du,首先将用户数据按它的喜好程度进行排序,从高到低,分两类,一类是用户喜爱程度相对高的称为高敏类,另外一类是用户喜爱程度相对较低的称为低敏类;

b、对用户高敏类数据进行数据保序混淆,具体步骤如下:

1)首先对隐私泄露进行度量;混淆数据学习的主要思想是将用户高敏类数据混淆成另一个用户的高敏类数据,数据相似,但是隐私泄露减少了,并且还能用于第三方推荐服务;

需要处理的用户数据为高敏类可以表示为 混淆后的用户数据表示为 该用户的隐私数据为Yu;在确定的用户隐私数据Yu的情况下,用户信息即为分别通过观察用户数据与用户混淆数据获取的信息量的差值ΔC,可用来表示用户隐私泄露量MI;信息量的大小可用信息论方法中的熵来表示,互信息与熵之间密不可分;则从用户数据 中获取的信息量可以表示为 如公式(1)所示;

则表示用户数据 中某个数据 出现的概率;如需求得互信息的值,则还需要计算条件熵, 与 之间的条件熵如公式(2)所示;

与 分别表示数据 和数据 的联合概率和条件概率;最终互

信息的计算如公式(3)所示;

2)然后在隐私泄露较小的情况下同时保证个性化推荐的数据效用,就需要限定数据失真范围T即排序损失程度;使用肯德尔相关系数Tau,用逆序对数量来量化两个排序列表的不一致程度;用户原始数据 和用户混淆数据 取第i个数据分别用 和 表示;

如果有 且 或者 且

时,则认为 与 是一对顺序一致的元素对,则其数量可表示为E,其中I

表示用户项目集即单个用户数据的数量;如果有 且 或者

且 则认为 与 是一对顺序不一致的元素对,则其

数量可表示为F;具体的肯德尔相关系数计算如公式(4)、公式(5)、公式(6)、公式(7)所示;

其中, 表示为 中数据的总个数,tu和tv分别表示 和 中数据的总个数,重复数据视为一个数据;cj和dj分别表示 和 中第j个数据的个数,重复数据视为一个数据;S则为 和 之间两两数据配对的总对数,因为 和 的数据总数是一致的,所以S可以用 的数据总个数来进行计算;A表示为 中重复数据进行两两数据配对的总对数;

B表示为 中重复数据进行两两数据配对的总对数;

3)最后获取最优的用户混淆数据,在上述测量用户隐私泄露量与计算肯德尔相关系数的基础上,进行条件约束来获取最优用户混淆数据即将另一用户的高敏类数据赋予当前需要混淆数据的用户;在此过程中,依据用户的不同隐私数据,进行某一类隐私数据的保护;

数据失真约束;为了减少隐私泄露,我们将用户数据Du混淆化;但又需要让混淆后的用户数据Dv还可以继续用于个性化推荐;所以在用户数据混淆的过程中,不仅需要对用户隐私泄露进行度量,还需要制定数据失真约束T,保证用户数据的效用;则数据失真约束模型可用公式 表示;

dc(Du,Dv)是Du与Dv之间距离的度量,T则限制了数据失真范围;保障混淆数据的实用性;

在给定的数据失真范围T下,最小化信息量差值ΔC来获得最优的混淆数据;

c、对用户低敏类数据进行数据噪声混淆:采用差分隐私的思想;直接给用户数据加入噪声,该噪声的产生满足差分隐私不等式;噪声产生的机制是拉普拉斯;该机制依据不同的随机变量α值,使用不同的服从参数为μ和 的Laplace逆累积分布函数,计算得出噪声值noise;直接在用户原有的数据上加上噪声值,保护用户隐私;在此机制基础上令其参数μ等于0,形成新的Laplace逆累积分布函数,公式如(8)所示:

2.根据权利要求1所述的一种基于排序分类的个性化推荐中的隐私保护方法,其特征在于,所述的步骤a中Du为用户u的数据集合,该数据为用户在各大媒体平台上活动留下的数据。