欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2019109142744
申请人: 浙江工业大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2023-08-24
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种融合属性和语义的概率矩阵分解冷启动推荐方法,其特征在于,所述方法包括以下步骤:

步骤1.收集大量用户和项目数据,数据包括用户属性信息、项目属性信息、用户对项目的评分信息和项目内容文本信息,以此为基础构建数据集;

步骤2.对项目内容文本信息进行分词、去除停用词预处理,然后对深度学习词向量模型进行训练获得词向量模型;

步骤3.将项目文本中的词通过词向量模型转换为向量,并利用词向量的加法运算法则结合TF‑IDF方法获得n个关键词向量及权重{vj1:wj1,vj2:wj2,...,vjm:wjm,...,vjn:wjn},其中vjm表示为项目j的第m个关键词的词向量,wjm表示为项目j的第m个关键词向量的TF‑TDF权重,将词向量累加平均获得项目内容文本向量表示项目j的内容文本向量,n为项目内容文本中提取的关键词总数;

步骤4.构建线性回归模型预测潜在特征,将用户属性集fu看作输入值,用户的属性集包括性别、年龄和职业,用户潜在特征向量看作输出值,用户潜在特征的线性预测方程表达为:

其中, 为用户i的预测潜在特征向量, 表示为用户i的属性信息,Wu表示为用户属性的权重矩阵;

相同的,将项目属性集fV看作输入值,项目潜在特征向量看作输出值,项目潜在特征的线性预测方程表达为:

其中,为项目j的预测潜在特征向量, 表示为项目j的属性信息,Wv表示为项目属性的权重矩阵;

对于项目语义潜在特征,将项目j的内容文本向量 看作线性预测的输入值,项目j的语义潜在特征向量看作输出值,项目语义潜在特征的线性预测方程表达为:其中, 为项目j的预测语义潜在特征向量, 表示为项目j的文本向量,Wq表示为项目内容文本向量的权重矩阵;

步骤5.将预测的潜在特征作为概率矩阵分解的先验概率对评分矩阵进行分解,和 分别作为Ui、Vj和Qj的条件概率,转化公式为:其中,Ui、Vj和Qj表示用户潜在特征、项目潜在特征和项目语义潜在特征,εui、εvj和εqj是高斯噪声:

假设权重参数集Wu、Wv和Wq中每个参数 和 都服从均值为零的高斯分布:整个线性回归预测模型的条件概率为:融合项目内容文本语义对用户评分的影响,整个评分矩阵R的条件概率分布重新定义为:

其中ω是调节参数,用来调控项目语义对用户评分的影响, 是指数函数,如果用户i对项目j有过评分,那么它的值为1,否则为0,rij是实际评分,经过贝叶斯推断,联合后的后验对数概率满足下式:

为了方便计算,进一步处理得到最终的损失函数:其中, ||·||F是

表示Frobenius范数;

步骤6.使用随机梯度下降法求解损失函数的局部最优解,整个模型最重要的模型参数分别为:用户潜在特征U,项目潜在特征V,项目语义潜在特征Q,线性预测模型中的模型参数Wu、Wv、Wq,参数求解步骤如下:

6.1)输入评分矩阵R,用户的属性信息fu,项目的属性信息fv和项目内容文本向量fq;

6.2)初始化参数Ui,Vj,Qj,Wu,Wv,Wq,α,ω;

6.3)当L不满足收敛时操作如下:

6.4)输出权重矩阵Wu,Wv,Wq和潜在特征矩阵Ui,Vj,Qj;

其中α为学习率, eij是预测评分与实际评分之间的误差;

步骤7.预测评分,选取评分最高的前n个项目作为推荐集,评分预测公式如下:其中, 表示为用户i对项目j的预测评分,对所有项目进行评分预测,然后选取评分最高的前n个作为用户i的推荐集Top‑n。