欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 202010370275X
申请人: 杭州电子科技大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-01-05
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于全贝叶斯方法的推荐系统评分推荐预测方法,其特征在于具体包括如下步骤:步骤1.根据用户过去的购买信息建立用户物品评分矩阵R0,矩阵为I*J维,I为参与测评的用户总数,J为参与测评的物品总数,用户i如果曾经购买了物品j,则用户i对物品j的评分矩阵元素R0ij为1,否则为0;

步骤2.根据物品属性信息建立物品词向量矩阵X0,矩阵为J*Voc维,J为参与测评的物品总数,而Voc为描述物品的属性信息的词典库的大小,每个物品都由一系列在词典库中的词描述而成,通过独热编码的方式,以0/1的方式表示是否利用x词来形容j物品;

步骤3.利用深度学习方法来提取物品词向量矩阵X0的特征信息,通过成批降噪变分自动编码机模型来提取这种特征信息;成批降噪变分自动编码机模型是整体构架模型的一部分,整体构架模型则为协同成批降噪变分自动编码机。

2.根据权利要求1所述的一种基于全贝叶斯方法的推荐系统评分推荐预测方法,其特征在于步骤3具体实现如下:

3-1.对输入的物品词向量矩阵X0添加噪声,来增加鲁棒性;

3-2.构建协同成批降噪变分自动编码机的网络结构;

3-3.训练协同成批降噪变分自动编码机,确定训练损失函数。

3.根据权利要求2所述的一种基于全贝叶斯方法的推荐系统评分推荐预测方法,其特征在于步骤3-1具体添加噪声实现如下:Xc=Xo*Mask (1)

其中,Xc为添加噪声后的物品词向量矩阵;X0为原始的物品词向量矩阵,[Mask]J*Voc为加噪矩阵,[Mask]J*Voc与X0具有相同的维度,同时[Mask]J*Voc元素满足二项分布。

4.根据权利要求2或3所述的一种基于全贝叶斯方法的推荐系统评分推荐预测方法,其特征在于步骤3-2具体如下:物品属性信息编码部分的网络结构为一个自动编码机,将输入的物品属性向量经过多个全连接层降维,得到降维后的物品特征向量;将得到的物品特征向量利用贝叶斯的方法进行编码,编码的结果即为需要的物品属性向量压缩编码结果,该压缩编码结果服从根据输入经过多个全连接层提取出来的特征向量的贝叶斯参数形成的正态分布;所述的贝叶斯参数包括均值以及方差;

接着利用相反维度的多个全连接层进行解码还原输入的物品属性向量。

5.根据权利要求4所述的一种基于全贝叶斯方法的推荐系统评分推荐预测方法,其特征在于所述的物品词向量矩中的每一行是物品属性向量。

6.根据权利要求4所述的一种基于全贝叶斯方法的推荐系统评分推荐预测方法,其特征在于所述的协同成批降噪变分自动编码机利用服从规则的正态分布来进行初始化,这种构架下的模型是一种全贝叶斯方法的模型;

初始化的公式如下所示:

Wl,*n为第l层权重矩阵Wl的第n列,bl为第l层的偏执矩阵,τj为求物品特征向量的偏置量,ui为用户隐因子向量;其中λw,λn,λu为超参数;

所述的用于降维和升维的全连接层的计算过程:

Xl,j*=σ(Xl-1,j*Wl+bl)

Xl,*j为第l层全连接层第j行的输出结果,其中σ表示激活函数;

所述的服从正态分布的贝叶斯参数的计算过程:

δ=10-6+log(1+eXafter)-1,

其中 代表均值,而δ代表标准差,假定模型的总层数为L,则XL/2为自动编码机最中间层的压缩特征矩阵,lens为压缩特征矩阵XL/2的列数目,而 被记为before_XL/2,被记为after_XL/2;Xencoded代表最终压缩结果;

进一步的,物品隐因子vj的计算:

vj=τj+Xencoded

所述的物品隐因子即物品特征向量;

进一步的,最终预测结果Rij的计算:

其中,C表示置信矩阵,因为之前提到的用户物品评分矩阵中的0元素,并不直接表明该用户不喜欢该物品,所以需要用置信矩阵来控制计算结果的可信程度,如果 计算结果大于0.5,置信矩阵中元素Cij设为a,否则,Cij则设为b。

7.根据权利要求6所述的一种基于全贝叶斯方法的推荐系统评分推荐预测方法,其特征在于步骤3-3所述的协同成批降噪变分自动编码机的训练,训练损失函数如下所示:loss1=λu||ui||2+λw(||Wi||2+||bi||2)      (4)loss=loss1+loss2        (6)

其中,公式(1)用最大似然估计的方法来最小化自动编码机的输入X0与输出XL之间的误差,公式(2)进行KL散度的计算,来计算编码的中间结果与标准正态分布N(0,1)之间的近似程度,编码中间结果服从 的分布;公式(3)最小化KL散度等同于最大化ELBO证据下界;公式(6)拆分为了公式(4)、(5),但最终都属于公式(6)里的loss函数计算;最终loss的计算包含5项,其中||·||2表示进行l2正则化,loss第一项用于使用户隐因子ui均值保持为

0,第二项用于避免过拟合,第三项用于使得物品隐因子vj与编码结果XEncoded尽可能接近,第四项用于最大化定分下界ELBO,最后一项用于最小化预测结果Rij与初始已知用户物品评分信息Roij;其中λw,λn,λu,λv,λx都是超参数。