1.一种基于k-medoids项目聚类和局部兴趣融合的用户协同过滤推荐方法,其特征在于,包括如下步骤:
1)采用最小化最大相似度准则确定K个初始聚类中心;
2)根据相似度和最大的k-medoids聚类算法对项目进行聚类;
3)在聚类基础上,寻找用户局部最近邻;
4)将用户全局最近邻与局部最近邻以相似度和之比作为权值进行融合,根据用户全局最近邻与局部最近邻对项目的评分,预测用户对项目的评分,完成推荐。
2.根据权利要求1所述的基于k-medoids项目聚类和局部兴趣融合的用户协同过滤推荐方法,其特征在于,步骤1)具体为:
1.1)使用余弦相似度计算所有样本点i,j之间的相似度sim(i,j),其中,i,j=
1,2,…,n,i≠j,将所有样本点之间相似度最小的两个样本点作为前两个初始聚类中心μ1和μ2;
1.2)计算未选为初始聚类中心的其它样本点i到已经被选定的每一个聚类中心μ1,μ2,…,μk的相似度sim(i,μ1),sim(i,μ2),…,sim(i,μk);
1.3)选择样本点i到已经被选定的聚类中心μ1,μ2,…μk的相似度中最大相似度为样本点i到聚类中心集的相似度sim(i,μ)=max{sim(i,μ1),sim(i,μ2),…,sim(i,μk)};
*
1.4)选取到聚类中心集的相似度最小值的样本点i为新增的第k+1个聚类中心μk+1,*sim(i,μ)=min{sim(1,μ),sim(2,μ),…sim(i,μ)…sim(n,μ)};
1.5)如果k+1<K,则赋值k=k+1,转步骤2),否则利用最小化最大相似度准则确定K个初始聚类中心的过程结束。
3.根据权利要求1所述的基于k-medoids项目聚类和局部兴趣融合的用户协同过滤推荐方法,其特征在于,步骤2)中,以余弦相似度作为样本点之间的度量,采用相似度和最大作为聚类准则函数,聚类后使得K个划分到达相似度和最大。
4.根据权利要求3所述的基于k-medoids项目聚类和局部兴趣融合的用户协同过滤推荐方法,其特征在于,步骤2)具体为:
2.1)使用余弦相似度计算所有样本点i,j之间的相似度sim(i,j),其中,i,j=
1,2,…,n,i≠j;
2.2)确定K个初始聚类中心μc,每一个聚类c的聚类中心μc为样本点,c=
1,2,…,K;
2.3)对于剩余的其他样本点i,i=1,2,…,n,i≠uc,c=1,2,…,K,则根据样本点i与步骤2.2)所述的聚类中心μc的相似度sim(i,μc),按相似度最大的*准则,将样本点i分配给与其最相似的聚类中心所代表的类c中,sim(i,μc*)=max{sim(i,μ1),sim(i,μ2),…,sim(i,μK)};
c
2.4)计算每个聚类的相似度和 其中,I表示聚类c中的所有项目;
计算所有K个聚类的相似度和 计算聚类内不同项目作为聚
类中心时的J值,按J值最大原则,选取J值最大的项目作为新的聚类中心;如果J值变大,则返回步骤2.2),否则聚类结束。
5.根据权利要求2或4所述的基于k-medoids项目聚类和局部兴趣融合的用户协同过滤推荐方法,其特征在于,步骤1.1)与步骤2.1)中,余弦相似度计算的公式如下:其中,Ui,j表示项目i和项目j共同评分的项目集,Ui表示项目i有评分的项目集,Uj表示项目j有评分的项目集,ru,i表示用户u对项目i的评分,ru,j表示用户u对项目j的评分,聚类后使得K个聚类划分的相似度和J值达到最大,利用皮尔森相似度、修正的余弦相似度等其它相似度也在保护范围内。
6.根据权利要求1所述的基于k-medoids项目聚类和局部兴趣融合的用户协同过滤推荐方法,其特征在于,步骤3)具体为:
3.1)通过聚类的方式划分用户兴趣,通过余弦相似度计算在每个聚类上用户之间的相c似度sim(u,v),公式如下:
其中,c表示项目i所在的聚类, 表示用户u和用户v在聚类c中共同评分的项目集, 表示用户u在聚类c中有评分的项目集, 表示用户v在聚类c中有评分的项目集,ru,i表示用户u对项目i的评分,rv,i表示用户v对项目i的评分;
3.2)选择与目标用户在项目i所在的聚类c上相似度最大的前N个用户作为目标用户的局部最近邻。
7.根据权利要求6所述的基于k-medoids项目聚类和局部兴趣融合的用户协同过滤推荐方法,其特征在于,步骤4)根据最近邻对项目的评分预测目标用户对项目的评分,最近邻为全局最近邻与局部最近邻以相应的权值进行融合。
8.根据权利要求7所述的基于k-medoids项目聚类和局部兴趣融合的用户协同过滤推荐方法,其特征在于,步骤4)中,基于用户的全局最近邻的预测评分公式如下:其中,p′u,i表示基于用户的全局最近邻的预测评分时用户u对项目i的预测评分,表示用户u的平均评分,v表示用户,neighborsu表示用户u的全局最近邻集合,sim(u,v)表示用户u和用户v的全局相似度,eu,v表示用户u和用户v的相似度相关加权,rv,i表示用户u对项目i的实际评分, 表示用户v的平均评分;
9.根据权利要求7所述的基于k-medoids项目聚类和局部兴趣融合的用户协同过滤推荐方法,其特征在于,步骤4)中,基于用户的局部最近邻的预测评分公式如下:其中,c表示项目i所在聚类,p″u,i表示基于用户的局部最近邻的评分计算得到的用户u对项目i的预测评分, 表示用户u在聚类c上的平均评分, 表示用户u在聚类c上的局部最近邻集合,simc(u,v)表示用户u和用户v在聚类c上的局部相似度,rv,i表示用户v对项目i的实际评分, 表示用户v在聚类c上的平均评分;
10.根据权利要求7所述的基于k-medoids项目聚类和局部兴趣融合的用户协同过滤推荐方法,其特征在于,步骤4)中,局部最近邻与全局最近邻以相应的权值结合后的预测评分公式如下:pu,i=p′ u,i*e′+p″u,i*e″;
局部最近邻和全局最近邻预测评分的权值分配通过局部最近邻相似度和与全局最近邻相似度和的比值设定e′和e″,公式如下:其中,e′+e″=1。