1.一种针对数据不均匀及数据稀疏的topN推荐系统,其特征在于,包括数据源获取模块,属性解析模块,模型构建模块,预测推荐模块,其中数据源获取模块用于获取用户信息、物品信息及用户社交网络好友信息;所述属性解析模块从数据源获取模块获取的用户信息集合,关注列表集合,项目信息集合中提取相关属性信息,将相关属性通过时间切片及时间离散化,然后利用带有时间信息的相关属性定义用户活跃度、物品流行度、用户对物品的兴趣三个相关函数指标;同时将用户评分观测序列利用时间衰弱函数间隔化,改进灰色系统理论模型;模型构建模块,用于利用改进后的灰色系统理论模型挖掘用户评分与待评价指标的显性关系,掌握用户评分规律;预测推荐模块,用于将任意时刻t的相关数据输入预测模型就能预测该时刻用户对物品的评分,同时将评分最高的N个物品推荐给用户。
2.根据权利要求1所述的针对数据不均匀及数据稀疏的topN推荐系统,其特征在于,所述构建模型模块挖掘用户评分与待评价指标的显性关系,包括以下三方面指标:第一,用户是否对物品评分、用户对物品的评分时间,物品的所属类别;第二,用户及其好友的标签信息及其对每个标签的使用次数;第三,用户评分集合及对物品评分的用户集合。
3.根据权利要求1或2所述的针对数据不均匀及数据稀疏的topN推荐系统,其特征在于,所述用户活跃度、物品流行度、用户对物品的兴趣三个相关函数指标表示三个指标与时间的相关关系,根据公式: 表示用户u在T时间对物品i的活跃度指标函数,其中 来统计用户在时刻T内的用户对项目的评分总数Ttotal,来统计用户对物品i所属类别的项目评分总数Ti,其中如果用户u
对物品j产生过行为,那么ruj=1,否则ruj=0;根据公式:
表示物品i在T时间的流行度指标函数,其中α1为衰减参数,t为用户对物品的评分时间;根据公式 表示用户在T时间对物品的兴趣,其中S(u,K)包含了和用户u兴趣相似的K个用户,这里我们利用社交网络信息用户好友代替相似兴趣的K个用户,其中α2为衰减参数。
4.根据权利要求3所述的针对数据不均匀及数据稀疏的topN推荐系统,其特征在于,所述用户在T时间对物品的兴趣 计算用户之间的相似度,其中N(u,v)表示用户u和用用户v的标签集合,n(b,u)表示用户u对标签b的使用次数。
5.根据权利要求1所述的针对数据不均匀及数据稀疏的topN推荐系统,其特征在于,所述改进灰色系统理论模型包括:数据预处理部分,序列等间隔部分及构建模型部分;数据预处理部分主要是将评分时间不合理或者过于集聚的部分数据清除;序列等间隔部分将非等间隔时间序列通过时间衰弱函数 其中α3是时间衰减参数,构建模型部分利用灰色GM(1,N)模型内容构建评分预测模型,再利用最小二乘估计法估计模型参数,得到GM(1,N)模型的状态方程。
6.根据权利要求5所述的针对数据不均匀及数据稀疏的topN推荐系统,其特征在于,用三个指标函数计算在t时刻的三个指标值,将三个指标值输入时间响应式得到要预测的评分。将预测的评分从大到小排列,将评分最高的N个物品推荐给用户。
7.根据权利要求1所述系统的针对数据不均匀及数据稀疏的topN推荐方法,其特征在于,包括以下步骤:获取用户信息、物品信息及社交网络好友信息;
从获取数据源中的用户信息集合,关注列表集合,项目信息集合中提取相关属性信息;
将属性通过时间切片及时间离散化方法加入时效性,然后利用带有时间信息的相关属性定义用户活跃度、物品流行度、用户对物品的兴趣三个相关函数指标;同时将用户评分观测序列利用时间衰弱函数等间隔化,改进灰色系统理论模型;
利用改进后的灰色GM(1,N)模型挖掘用户评分与三方面指标的显性关系,掌握用户评分规律;
将任意时刻t的相关数据输入预测模型就能预测该时刻用户对物品的评分,同时将评分最高的N个物品推荐给用户。