1.一种跨域协同过滤方法,其特征在于,包括以下步骤:将用户项目评分数据转换为分类算法的训练样本集;
对每个辅助域的用户项目评分矩阵进行Funk-SVD分解,得到用户潜在向量;
使用所述用户潜在向量扩展所述训练样本集中用户的特征向量,得到第一扩展训练样本集;
添加项目特征信息来扩展第一扩展训练样本集中项目的特征向量得到第二扩展训练样本集;
使用所述第二扩展训练样本集训练不平衡分类器;
基于所述不平衡分类器预测所述用户项目评分数据的缺失数据并生成推荐。
2.根据权利要求1所述的跨域协同过滤方法,其特征在于,将用户项目评分数据转换为分类算法的训练样本集,具体为:采用Lu表示用户在用户项目评分矩阵中的行,采用Li表示项目在用户项目评分矩阵中的列;
基于特征向量(Lu,Li)构造用户项目评分数据的分类算法训练样本集{(Lu,Li,Rui)|(u,i)∈κ},其中κ是评分矩阵中有评分的“用户-项目”对的集合,Rui表示用户u对项目i的评分。
3.根据权利要求2所述的跨域协同过滤方法,其特征在于,对每个辅助域的用户项目评分矩阵进行Funk-SVD分解得到用户潜在向量,具体包括:设定目标函数
采用pu+γ(euiqi-λpu)和qi+γ(euipu-λqi)更新pu和qi,以优化所述目标函数;其中,λ为正则化参数,γ为学习速率;
基于优化结果得到第j个辅助域上用户u的潜在向量 其中j从1到K,K为辅助域的个数。
4.根据权利要求1所述的跨域协同过滤方法,其特征在于,使用所述第二扩展训练样本集训练不平衡分类器,具体包括:初始化所述第二扩展训练样本集中每个样本的样本权重为 其中,A为样本数,1≤a≤A;
以下步骤重复T次:
1)根据第t次迭代时,所有样本权重{Dt(xa)|1≤a≤A},训练并得到弱分类器ht;其中,t从1至T;
2)计算每个训练样本xa的惩罚项pt=1-|amb|, 其中,为弱分类器的权重;
3)使用 更新样本权重;其中,Zt为正则化因
子,λ∈[0.5,12]为所述惩罚项的更新步长;
计算不平衡分类器
5.一种跨域系统过滤系统,其特征在于,包括训练样本转换模块、用户潜在向量生成模块、训练样本第一扩展模块、训练样本第二扩展模块、不平衡分类器训练模块和推荐模块;
所述训练样本转换模块,用于将用户项目评分数据转换为分类算法的训练样本集;
所述用户潜在向量生成模块,用于对每个辅助域的用户项目评分矩阵进行Funk-SVD分解,得到用户潜在向量;
所述训练样本第一扩展模块,用于使用所述用户潜在向量扩展所述训练样本集中用户的特征向量,得到第一扩展训练样本集;所述训练样本第二扩展模块,用于添加项目特征信息扩展所述第一扩展训练样本集中项目的特征向量得到第二扩展训练样本集;
所述不平衡分类器训练模块,用于使用所述第二扩展训练样本集训练不平衡分类器;
所述推荐模块,用于基于所述不平衡分类器预测所述用户项目评分数据的缺失数据并生成推荐。
6.根据权利要求5所述的跨域协同过滤系统,其特征在于,所述训练样本转换模块具体用于,采用Lu表示用户在用户项目评分矩阵中的行,采用Li表示项目在用户项目评分矩阵中的列,并基于特征向量(Lu,Li)构造用户项目评分数据的分类算法训练样本集{(Lu,Li,Rui)|(u,i)∈κ},其中κ是评分矩阵中有评分的“用户-项目”对的集合,Rui表示用户u对项目i的评分。
7.根据权利要求6所述的跨域协同过滤系统,其特征在于,所述用户潜在向量生成模块包括目标函数设定单元、目标函数优化单元和用户潜在向量生成单元;
所述目标函数设定单元,用于设定目标函数
所述目标函数优化单元,用于采用pu+γ(euiqi-λpu)和qi+γ(euipu-λqi)更新pu和qi,以优化所述目标函数;其中,λ为正则化参数,γ为学习速率;
所述用户潜在向量生成单元,用于基于优化结果得到第j个辅助域上用户u的潜在向量其中j从1到K,K为辅助域的个数。
8.根据权利要求5所述的跨域协同过滤方法,其特征在于,所述不平衡分类器训练模块包括样本权重初始化单元、弱分类器训练单元、样本权重更新单元和不平衡分类器生成单元;
所述样本权重初始化单元,用于初始化所述第二扩展训练样本集中每个样本的样本权重为 其中,A为样本数,1≤a≤A;
所述弱分类器训练单元,用于根据第t次迭代时,所有样本权重{Dt(xa)|1≤a≤A}训练并得到弱分类器ht;其中,t从1至T;
所述样本权重更新单元,用于计算每个训练样本xa的惩罚项pt=1-|amb|,其中, 为弱分类器
的权重;使用 更新样本权重;其中,Zt为正则化因子,λ∈[0.5,12]为所述惩罚项的更新步长;
所述不平衡分类器生成单元,用于在所述弱分类器训练单元和所述样本权重更新单元重复T次计算后,计算不平衡分类器