1.基于大数据协同过滤技术的电商平台商品推荐方法,其特征在于,该方法包括:收集用户在电商平台上的商品浏览或交易记录,列出用户对商品的评价表,表中各单元格表示用户对商品的评分;
根据商品类别建立多维属性,每维属性定义若干个属性值,为评价表中所有商品划分属性及其属性值;
针对每位用户提取已评价商品,统计所有已评价商品在每维属性下各属性值的计数,结合评分计算每位用户中各属性值的均值;
利用属性值的均值计算各属性值的权重;
针对每位用户提取每种未评价商品,进一步获取未评价商品的所有属性值,利用属性值的权重计算获得未评价商品的预估分;
删除评价表中预估分仍为零的单元格,根据用户对商品的评价表建立商品对用户的倒查表,即对每种商品都保存对该商品评分过的用户列表;
根据倒查表统计各商品在所有用户中被评价的累计次数,及所有商品的被评价次数的均值;
根据商品被评价次数及均值进一步计算热度相关系数;
将热度相关系数与皮尔逊关系函数相结合,利用改进的皮尔逊关系函数计算目标用户与待推荐用户之间的相似度;
按降序对计算获得的相似度进行排序,提取排序靠前的若干相似度值所对应的待推荐用户作为邻近用户,然后以临近用户进一步计算待推荐商品的推荐指数;
按降序对推荐指数进行排序,选择排序靠前的若干推荐指数所对应的商品向目标用户推荐。
2.根据权利要求1所述的基于大数据协同过滤技术的电商平台商品推荐方法,其特征在于,所述各属性值的均值通过以下公式计算:其中:nij表示已评价商品中第i维属性下第j个属性值的计数,αm表示第m个计数的评分,βij表示第i维属性下第j个属性值的均值。
3.根据权利要求1所述的基于大数据协同过滤技术的电商平台商品推荐方法,其特征在于,所述属性值的权重通过以下公式计算:其中N表示所有商品的种类计数,kij表示所有商品中第i维属性下第j个属性值的计数,Wij表示第i维属性下第j个属性值的权重。
4.根据权利要求1所述的基于大数据协同过滤技术的电商平台商品推荐方法,其特征在于,所述未评价商品的预估分通过以下公式计算:其中:T表示属性计数,当未评价商品存在第i维属性下第j个属性值时,系数rij记为1,否则记为0,g表示系数rij记为1的总数。
5.根据权利要求1所述的基于大数据协同过滤技术的电商平台商品推荐方法,其特征在于,商品的被评价次数的均值通过以下公式计算:其中,S表示商品种类的计数,ω表示第ω种商品,aω表示第ω种商品被评价的次数。
6.根据权利要求1所述的基于大数据协同过滤技术的电商平台商品推荐方法,其特征在于,所述的热度相关系数通过以下公式计算:其中,δω表示第ω种商品的热度相关系数。
7.根据权利要求1所述的基于大数据协同过滤技术的电商平台商品推荐方法,其特征在于,用户之间的相似度通过以下公式计算:其中,Iu表示目标用户u已评价的商品种类集合,Iv表示待推荐用户v已评价的商品种类集合, 表示用户u的评分均值, 表示用户v的评分均值。
8.根据权利要求1所述的基于大数据协同过滤技术的电商平台商品推荐方法,其特征在于,待推荐商品的推荐指数通过以下公式计算:其中,v′表示临近用户,F表示临近用户的集合,G(x)表示对第x种待推荐商品有评分记录的用户集合,s(u,v′)表示目标用户u与临近用户v′之间的相似度,rv′,x表示临近用户v′对第x种待推荐商品的评分或预估分, 表示临近用户v′的评分均值。
9.根据权利要求1所述的基于大数据协同过滤技术的电商平台商品推荐方法,其特征在于,在计算获取商品被评价次数之后,还包括:当商品被评价次数超过设定的阈值时,在倒查表中删除超出阈值的商品被评价次数所对用的商品种类。
10.根据权利要求1所述的基于大数据协同过滤技术的电商平台商品推荐方法,其特征在于,还包括推荐指数修正步骤:统计目标用户已评价商品作为训练样本,利用临近用户计算训练样本的推荐指数,结合商品的实际评分通过以下公式计算获得修正系数:其中,σ表示修正系数,pu,t表示训练样本t的推荐指数,qu,t表示训练样本t的实际评分,表示目标用户u已评价商品评分均值,H(t)表示训练样本的集合;
进一步,利用修正系数对推荐指数进行修正:p′u,ω=pu,ω(1‑σ)
其中,pu,ω和p′u,ω分别表示修正前后的推荐指数。
11.基于大数据协同过滤技术的电商平台商品推荐系统,其特征在于,所述系统包括:数据仓库:存储用户在电商平台上的商品浏览或交易记录,记录包含用户购买商品的评价信息,以及根据用户端浏览商品网页停留的时长、用户的基本信息由平台自动生成的用户评价信息;
商品评价信息采集器:从数据仓库收集用户在电商平台上的商品浏览信息或交易记录,列出用户对商品的评价表,其中评价表的首列表示用户标识码,首行表示商品标识码,表中各单元表示用户对商品的评分,已评价的商品评分范围取:1~5分,未评分的商品取值为空;
商品多维属性生成模块:根据商品类别建立多维属性,每维属性定义若干个属性值,为评价表中所有商品划分属性及其属性值;
商品评价信息重构模块:针对每位用户提取已评价商品,统计所有已评价商品在每维属性下各属性值的计数,结合评分计算各属性值的均值;利用属性值的均值计算各属性值的权重;针对每位用户提取未评价商品,进一步获取未评价商品的所有属性值,利用属性值的权重计算获得未评价商品的预估分;
商品无效信息清理模块:删除评价表中预估分仍为零的单元格,根据用户对商品的评价表建立商品对用户的倒查表,即对每种商品都保存对该商品评分过的用户列表;
商品热度信息分析模块:根据倒查表统计各商品被评价的次数,及所有商品的被评价次数的均值;根据商品被评价次数及均值进一步计算热度相关系数;
用户相似度分析模块:将热度相关系数与皮尔逊关系函数结合,利用改进的皮尔逊关系函数计算目标用户与待推荐用户之间的相似度;
商品推荐指数生成模块:按降序对计算获得的相似度进行排序,提取排序靠前的相似度值所对应的待推荐用户作为临近用户,然后以临近用户进一步计算待推荐商品的推荐指数;按降序对推荐指数进行排序,选择排序靠前的推荐指数所对应的商品向目标用户推荐;
商品推荐指数修正模块:统计目标用户已评价商品作为训练样本,利用临近用户计算训练样本的推荐指数,结合商品的实际评分通过以下公式计算获得修正系数,利用修正系数对推荐指数进行修正。