欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2019109142918
申请人: 浙江工业大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2023-12-11
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种用户属性耦合相似和兴趣语义相似的协同过滤推荐方法,其特征在于,输入包括用户‑项目评分矩阵、用户注册信息、项目文本信息和目标用户u;输出为目标用户u的Top‑n推荐集;所述方法包括以下步骤:步骤1.收集大量用户和项目数据,数据包括用户注册信息、用户对项目的评分信息和项目内容文本信息,以此为基础构建数据集;

步骤2.对项目内容文本信息进行分词和去除停用词预处理,然后对深度学习词向量模型进行训练获得词向量模型;

步骤3.将项目文本中的词通过词向量模型转换为向量,并利用词向量的加法运算法则结合TF‑IDF方法获得n个关键词向量及权重{vi1:wi1,vi2:wi2,…,vim:wim,…,vin:win},其中vim表示为项目i的第m个关键词的词向量,wim表示为项目i的第m个关键词向量的TF‑TDF权重,将词向量累加平均获得项目的文本向量Ii表示项目的内容文本向量,n为项目内容文本中提取的关键词总数;

步骤4.分析用户的兴趣内容向量,并计算用户的兴趣内容语义相似度simp(u,v),结合用户评分信息获得用户兴趣内容向量,用户u兴趣内容向量公式如下:其中Pu表示用户u的兴趣内容向量,I(u)为用户u所有历史项目集合,ru,i为用户u对项目i的评分,用户兴趣内容的语义相似度可以根据余弦公式获得,但是由于向量之间的余弦值范围在‑1到1之间,为了将用户兴趣内容的语义相似度范围定在0到1之间,所以改进后的用户兴趣内容的语义相似度公式为

步骤5.对用户注册信息预处理并提取用户属性,计算用户属性的耦合相似度sima(u,v)上述公式中 是用户u和用户v在属性j上的耦合相似度CAVS,且sima(u,v)∈[0,1],其值越高代表越相似,l是属性的数量;

耦合属性值相似度CAVS由特征内耦合属性值相似度IaAVS和特征间耦合属性值相似度IeAVS两部分组成,特征j上属性值uj和vj之间的耦合属性值相似度定义为:和 分别为特征内耦合属性值相似度IaAVS和特征间耦合属性值相似度IeAVS;

特征内耦合属性值相似度IaAVS是站在属性值频率分布角度衡量不同属性值的相似度,定义如下:

公式中gj(uj)和gj(vj)分别是用户集合中用户属性j上属性值为uj和vj的用户集合;

特征间耦合属性值相似度IeAVS是站在属性间依赖聚合角度衡量不同属性值的相似度,定义如下:

ωk是用户属性特征k的权重,且 δj|k(uj,vj)是属性值uj,vj在属性特征j下的特征间耦合属性相似度,定义如下:上式中∩表示属性j取值为uj和vj的条件下,属性k的属性值的所有取值集合的交集,Pk|j(w|uj)是描述属性j属性值为uj的条件下,属性k属性值为w的概率分布,定义如下:步骤6.结合用户属性耦合相似度和用户兴趣内容语义相似度动态计算用户的综合相似度simw(u,v),公式为:

simw(u,v)=αsimp(u,v)+(1‑α)sima(u,v)公式中 |I(u)|是用户u所有历史项目集合的数量,|Imax|是所有用户中最大的历史项目集合的数量,α表示了用户u的活跃度,如果用户u是新用户,即用户u没有历史项目, 即|I(u)|=0时,那么用户u的活跃度α=0,综合相似度只考虑用户属性耦合相似度,随着用户u的历史项目集合|I(u)|的增加,用户u的活跃度α会逐渐增大,从而实现综合相似度的动态计算;然后选取与用户u相似度最高的前k个用户作为用户u的最近邻用户集合K(u);

步骤7.预测评分,选取评分最高的前n个项目作为推荐集;

公式中 表示预测用户u对项目i的评分,simw(u,v)表示用户u与用户v的综合相似度,K(u)是用户u的近邻用户集合,预测完评分后,选取评分最高的前n个作为用户u的推荐集Top‑n。