1.一种互联网内容推荐方法,其特征在于,包括:
从n个已知用户中选取k个作为候选引导者,初始化各所述候选引导者涉及项目类型的权重;k和n均为大于1的正整数且k≤n;
对各所述候选引导者涉及项目类型的权重进行训练,以更新各所述候选引导者涉及项目类型的权重,选取更新后的各所述项目类型对应的权重最高的所述候选引导者作为引导者;
新用户进行面试时,通过所述新用户选择的项目类型对应的所述引导者对所述新用户进行内容推荐。
2.根据权利要求1所述的一种互联网内容推荐方法,其特征在于,所述从n个已知用户中选取k个作为候选引导者,初始化各所述候选引导者涉及项目类型的权重,包括:根据n个所述已知用户的历史交互数据建立评级训练模型,如下式:T
rij′=u+mi+bj+qjpi;
式中:rij′表示第i个已知用户第j个项目的预测评级,u表示真实评级的平均值,mi表示第i个已知用户的偏置,bj表示第j个项目类型的偏置,qj表示第j个项目类型的潜在因子,pi表示第i个已知用户的潜在因子,piT表示pi的转置,qjpiT表示qj与piT之间的内积;
采用随机梯度下降法对所述评级训练模型中的参数进行更新,如下式:mi←mi+α[(rij-rij′)-β*mi];
bj←bj+α[(rij-rij′)-β*bj];
qj←qj+α[(rij-rij′)*piT-β*qj];
pi←pi+α[(rij-rij′)*qj-β*pi];
式中:α和β均为超参数,rij表示第i个已知用户第j个项目的真实评级;
根据参数更新后的所述评级训练模型得到各所述已知用户涉及的项目类型的预测评级,根据所述预测评级和所述真实评级得到各所述已知用户涉及项目类型的均方根误差,根据各所述已知用户涉及项目类型的数量和所述均方根误差选取k个已知用户作为候选引导者;
初始化各所述候选引导者涉及的项目类型的权重。
3.根据权利要求2所述的一种互联网内容推荐方法,其特征在于,所述对各所述候选引导者涉及项目类型的权重进行训练,以更新各所述候选引导者涉及项目类型的权重,选取更新后的各所述项目类型对应的权重最高的所述候选引导者作为引导者,包括:按照设定比例对除了所述候选引导者之外的所述已知用户进行随机分组,得到两组用户集,选取两组用户集中比例系数高的一组作为训练用户集;
令所述训练用户集中的训练用户随机选取设定数量的所述项目类型;
建立权重训练模型,如下式:
Wyj←Wyj+(a-func(ejy,ejl′));
式中:Wyj表示第y个候选引导者第j个项目类型的权重,a表示已知用户的均方根误差的和,ejy表示第y个候选引导者第j个项目类型的真实评级,ejl′表示第l个训练用户第j个项目类型的预测评级,func(ejy,ejl′)=∑(ejy-ejl′)/|Sy|,Sy表示第y个候选引导者涉及项目类型的评级的集合,|Sy|表示Sy的元素数量;
根据所述权重训练模型得到更新后的各所述候选引导者涉及项目类型的权重;
通过更新后的权重选取各所述项目类型对应的权重最高的所述候选引导者作为引导者。
4.根据权利要求1所述的一种互联网内容推荐方法,其特征在于,所述新用户进行面试时,通过所述新用户选择的项目类型对应的所述引导者对所述新用户进行内容推荐,包括:对新用户进行面试,以选取项目类型;
所述引导者根据新用户选择的项目类型生成内容推荐列表;
根据设定条件对所述内容推荐列表中的内容进行判断,若符合要求,则推荐给所述新用户,若不符合要求,则舍弃。
5.根据权利要求4所述的一种互联网内容推荐方法,其特征在于,所述设定条件包括:一是所述引导者在所述内容推荐列表中的内容对应的项目类型上的真实评级高于设定分数阈值;
二是所述内容推荐列表中的内容对应的项目类型的评级次数大于所述已知用户的数量的设定百分比。
6.一种互联网内容推荐系统,其特征在于,包括:
候选引导者确定及处理模块,用于从n个已知用户中选取k个作为候选引导者,初始化各所述候选引导者涉及项目类型的权重;k和n均为大于1的正整数且k≤n;
引导者确定模块,用于对各所述候选引导者涉及项目类型的权重进行训练,以更新各所述候选引导者涉及项目类型的权重,选取更新后的各所述项目类型对应的权重最高的所述候选引导者作为引导者;
内容推荐模块,用于新用户进行面试时,通过所述新用户选择的项目类型对应的所述引导者对所述新用户进行内容推荐。
7.根据权利要求6所述的一种互联网内容推荐系统,其特征在于,所述候选引导者确定及处理模块,包括:评级训练模型确定单元,用于根据n个所述已知用户的历史交互数据建立评级训练模型,如下式:rij′=u+mi+bj+qjpiT;
式中:rij′表示第i个已知用户第j个项目的预测评级,u表示真实评级的平均值,mi表示第i个已知用户的偏置,bj表示第j个项目类型的偏置,qj表示第j个项目类型的潜在因子,pi表示第i个已知用户的潜在因子,piT表示pi的转置,qjpiT表示qj与piT之间的内积;
参数更新单元,采用随机梯度下降法对所述评级训练模型中的参数进行更新,如下式:mi←mi+α[(rij-rij′)-β*mi];
bj←bj+α[(rij-rij′)-β*bj];
T
qj←qj+α[(rij-rij′)*pi-β*qj];
pi←pi+α[(rij-rij′)*qj-β*pi];
式中:α和β均为超参数,rij表示第i个已知用户第j个项目的真实评级;
候选引导者确定单元,用于根据参数更新后的所述评级训练模型得到各所述已知用户涉及的项目类型的预测评级,根据所述预测评级和所述真实评级得到各所述已知用户涉及项目类型的均方根误差,根据各所述已知用户涉及项目类型的数量和所述均方根误差选取k个已知用户作为候选引导者;
候选引导者处理单元,用于初始化各所述候选引导者涉及的项目类型的权重。
8.根据权利要求7所述的一种互联网内容推荐系统,其特征在于,所述引导者确定模块,包括:训练用户集确定单元,用于按照设定比例对除了所述候选引导者之外的所述已知用户进行随机分组,得到两组用户集,选取两组用户集中比例系数高的一组作为训练用户集;
项目类型选取单元,令所述训练用户集中的训练用户随机选取设定数量的所述项目类型;
权重训练模型确定单元,用于建立权重训练模型,如下式:Wyj←Wyj+(a-func(ejy,ejl′));
式中:Wyj表示第y个候选引导者第j个项目类型的权重,a表示已知用户的均方根误差的和,ejy表示第y个候选引导者第j个项目类型的真实评级,ejl′表示第l个训练用户第j个项目类型的预测评级,func(ejy,ejl′)=∑(ejy-ejl′)/|Sy|,Sy表示第y个候选引导者涉及项目类型的评级的集合,|Sy|表示Sy的元素数量;
权重更新单元,用于根据所述权重训练模型得到更新后的各所述候选引导者涉及项目类型的权重;
引导者确定单元,通过更新后的权重选取各所述项目类型对应的权重最高的所述候选引导者作为引导者。
9.根据权利要求6所述的一种互联网内容推荐系统,其特征在于,所述内容推荐模块,包括:面试单元,用于对新用户进行面试,以选取项目类型;
内容推荐列表确定单元,所述引导者根据新用户选择的项目类型生成内容推荐列表;
判断单元,用于根据设定条件对所述内容推荐列表中的内容进行判断,若符合要求,则推荐给所述新用户,若不符合要求,则舍弃。
10.根据权利要求9所述的一种互联网内容推荐系统,其特征在于,所述设定条件包括:一是所述引导者在所述内容推荐列表中的内容对应的项目类型上的真实评级高于设定分数阈值;
二是所述内容推荐列表中的内容对应的项目类型的评级次数大于所述已知用户的数量的设定百分比。