1.一种应用于推荐系统中的自然噪声模糊管理方法,其特征在于,包括以下步骤:步骤1、获取推荐系统的评分数据,并利用三分法对推荐系统中的评分进行分类,建立每个类别的隶属度函数,得到评分的模糊集表示;
步骤2、根据评分的模糊集表示分别建立用户和项目的模糊集表示,所述模糊集表示用户或项目分别在低分、中分、高分的倾向;
步骤3、根据用户和项目的模糊集表示预估任意用户u对项目i的评分的模糊集表示,并进行归一化处理;
步骤4、根据噪声检测规则进行自然噪声检测;
步骤5、自然噪声修正:根据最大隶属度原则,对已经检测出的噪声数据进行修正,对所有噪声修正完成后形成新的数据集;
所述步骤1利用三分法对推荐系统中评分进行分类,并建立每个类别的隶属度函数,并得到评分的模糊集表示,具体包括:评分预划分为三个类别:低分(low),中分(medium),高分(high),低分隶属度函数为A1,中分隶属度函数为A2,高分隶属度函数为A3,根据三分法有:a、b分别表示低分‑中分(low‑medium)分界点所满足的正态分布的均值和中分‑高分(medium‑high)分界点所满足的正态分布的均值,σ1、σ2分别表示低分‑中分(low‑medium)分界点所满足的正态分布的方差和中分‑高分(medium‑high)分界点所满足的正态分布的方差,其中R代表推荐系统的评分范围集合,minR和maxR分别为最小值和最大值运算,round为取整运算;
根据低分(low),中分(medium),高分(high)的隶属度函数,任意一个评分的模糊集表示为:Fr=(A1(r),A2(r),A3(r))。
2.根据权利要求1所述的一种应用于推荐系统中的自然噪声模糊管理方法,其特征在于,所述步骤2根据评分的模糊集表示分别建立用户和项目的模糊集表示,该模糊集表示用户或项目分别在低分(low),中分(medium),高分(high)的倾向,具体为:用户模糊集(Fu):
项目模糊集(Fi):
其中,Ru表示用户提供的历史评分集合, 分别表示用户u在低分,中分和高分上的倾向, 分别表示项目i在低分,中分和高分的倾向,r表示一个特定的评分值,Ri表示项目获得的历史评分集合,函数|·|返回一个集合的大小。
3.根据权利要求2所述的一种应用于推荐系统中的自然噪声模糊管理方法,其特征在于,所述步骤3根据用户和项目的模糊集表示预估任意用户u对项目i的评分的模糊集表示,并进行归一化处理,具体包括:p
根据用户和项目的模糊集表示预估任意用户u对项目i的评分的模糊集Fr 表示:其中 分别表示预估评分在低分,中分和高
分上隶属度;
对上式进行归一化处理,
4.根据权利要求3所述的一种应用于推荐系统中的自然噪声模糊管理方法,其特征在于,所述步骤4根据噪声检测规则进行自然噪声检测,具体包括:自然噪声检测:任意用户u对项目i的原始评分令为 d为原始评分和预估评分之间的误差,公式为: 其中函数|·|2表示L2范氏;
将误差d映射到[0,1]空间,为: s代表原始评分 和预估评分 的相似性,通过实验设置合适的阈值δ控制数据集含噪程度,据此建立噪声检测规则;
噪声检测规则:当s<δ,原始评分 被认为是自然噪声。
5.根据权利要求4所述的一种应用于推荐系统中的自然噪声模糊管理方法,其特征在于,所述步骤5.自然噪声修正:根据最大隶属度原则,对已经检测出的噪声数据进行修正,规则如下:当 自然噪声用a代替,
当 自然噪声用(a+b)/2代替,
当 自然噪声用b代替;
其中,a、b分别表示低分‑中分(low‑medium)分界点所满足的正态分布的均值和中分‑高分(medium‑high)分解点所满足的正态分布的均值,对所有噪声修正完成后形成新的数据集。
6.一种存储介质,该存储介质内部存储计算机程序,其特征在于,所述计算机程序被处理器读取时,执行上述权利要求1~5任一项的方法。