欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2016111443801
申请人: 重庆邮电大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-02-23
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种针对用户角色无差异对待和数据稀疏的推荐系统,其特征在于,包括数据源信息获取模块、动态角色划分模块及预测推荐模块;其中,数据源信息获取模块,用于获取包括用户对项目的评分数据和项目数据在内的网页数据内容;动态角色划分模块,用于根据用户的评分历史记录,动态划分用户动态角色列表,并用户评分数据层次化处理;预测推荐模块,构建基于用户-项目-角色的三阶张量分解评分预测模型,利用处理后的用户评分数据,填充张量分解模型,实现数据维度转换;然后基于缺失值处理方法,利用CP分解预测缺失值,通过对缺失值逐次迭代,优化处理过程,根据张量分解模型预测的评分结果,生成目标用户推荐列表;

所述动态角色划分模块分为用户角色类型计算和对用户进行动态角色划分,最终实现用户评分数据层次化分割,首先,根据用户对项目的历史评分行为,依次得到目标用户u所评分项目i的所属类别Ci;其次,引入信息熵理论度量信息源不确定性的特点,按项目类别多样性对用户进行定量角色划分;再次,基于用户兴趣迁移现象,利用用户对项目的评分密度以及时间切片方法,对用户评分行为进行时间段划分;最后,计算用户在不同时间段下的角色分布状态,动态划分用户角色。

2.根据权利要求1所述的针对用户角色无差异对待和数据稀疏的推荐系统,其特征在于,所述数据源信息获取模块获取原始数据首先通过公开API接口下载数据,再利用网络爬虫技术补充,对原始数据中的重复数据、无效数据进行清洗。

3.一种针对用户角色无差异对待和数据稀疏的推荐方法,其特征在于,包括以下步骤:

1)、获取用户历史评分行为,基于用户评分密度,利用时间切片方法对用户划分评分时间段;

2)、引入信息熵理论对个体进行角色划分,其按用户兴趣多样性对用户每个时间段的行为进行定量分析,实现用户角色动态性划分,对评分数据层次化处理;步骤2)用户动态角色划分包括步骤:S21:提取用户对项目的评分时间数据,设定密度阈值,选取高密度评分时间段,为用户评分行为划分时间区域,被划分的时间区域表示用户的不同兴趣时间段;

S22:设定角色数|R|,即为模型中角色分布数量,为将定性角色划分方式转换为定量角色划分方式,引入信息熵理论,度量用户评分项目多样性,计算用户u在第j个时间段的角色值Val(Ru,j),划分用户所属角色,然后根据用户u有效时间段列表T(u),对其每一段时间进行角色划分;

S23:依次计算用户u在社交网站上的角色类型,同时生成用户角色列表,实现用户评分数据层次化处理;

3)、构建基于“用户-项目-角色”的张量分解评分预测模型,利用张量分解在数据维度转换和数据压缩的特性,最终生成目标用户项目推荐列表。

4.根据权利要求3所述的针对用户角色无差异对待和数据稀疏的推荐方法,其特征在于,所述步骤3)构建基于“用户-项目-角色”的张量分解评分预测模型,利用张量分解在数据维度转换和数据压缩的特性,最终生成目标用户项目推荐列表包括:S31:基于用户角色划分的概念,引用张量分解模型在数据维度转换和数据压缩的特性,构建基于“用户-项目-角色”的三阶张量分解评分预测模型,为该模型的初始填充值是用户u在角色类型Cat(Ru,j)下,对项目k的评分值score,利用缺失值处理,通过CP分解法填充缺失值,预测用户对项目的评分;

S311:处理层次化的用户评分数据,构建“用户-项目-角色”的张量分解模型,该三阶张量  i表示用户维度的个体数量,j表示项目维度的个体数量;k表示角色维度的个体数量;

S312:将用户i在第k个角色下对第j个项目的评分填入张量模型相应位置,作为评分预测的初始值;

S313:对缺失值进行处理,使用CP分解法,首先假设张量的秩为R,那么就把张量分解成R个秩-1张量的和,对于一个三阶张量,CP分解写成向量和形式:其中, 为CP分解的缩写形式,λ是长度为R的向量,A、B、C分别为CP分解中的三个因子矩阵;

S32:利用经过动态化角色处理的评分数据,结合张量分解模型,得到用户对项目的预测评分,根据预测评分,使用排序算法对每个用户的评分进行从高到低的排序,得到最终用户-项目推荐列表。