欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2019113134280
申请人: 江西财经大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-03-14
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于卷积神经网络与降噪自编码器的信息推荐方法,其特征在于,包括以下步骤:

步骤一,深度分析数据信息,对评分信息、信任信息和评论信息进行分类和过滤;

步骤二,深度学习卷积神经网络模型和降噪自编码器模型,所述卷积神经网络模型通过过滤函数,以并行的方式沿着固定大小的滑动窗口处理输入序列,最终输出序列的隐藏特征矩阵,再经过池化层输出具有代表性部分的隐藏特征向量;所述降噪自编码器模型通过加入噪声影响原始的输入数据来增加自身编码和重构数据时的难度,通过一个狭窄的神经网络,使用噪声版本重构输入数据,获得特征表示,避免所述卷积神经网络模型过度拟合;

步骤三,利用降噪自编码器模型原理建立基于卷积神经网络与降噪自编码器的信息融合推荐模型;首先将所述评论信息输入所述卷积神经网络模型,生成隐藏特征向量,进而生成用户对所有项目的喜好程度值所构成的向量;然后用三个并列的所述降噪自编码器模型分别处理输入的评分信息、信任信息和评论信息,生成相应的预测向量,并对生成的所述预测向量进行加权融合;最终生成目标用户的相应的推荐列表。

2.如权利要求1所述的基于卷积神经网络与降噪自编码器的信息推荐方法,其特征在于,步骤一中的所述数据信息包括所述评分信息、所述信任信息和所述评论信息;所述评分信息按照喜好程度分为五级并分别对应赋值为1至5;所述信任信息分为信任关系和非信任关系并对应赋值为1和0;所述评论信息采用用户对物品的评价信息,所述评论信息用于分析用户的购买和评分行为。

3.如权利要求1所述的基于卷积神经网络与降噪自编码器的信息推荐方法,其特征在于,步骤二中的所述卷积神经网络模型用于对用户的所述评论信息做出初步的处理,提取文本的隐藏特征向量,进而得出用户对所有项目的喜好程度值所构成的向量。

4.如权利要求3所述的基于卷积神经网络与降噪自编码器的信息推荐方法,其特征在于,步骤一中的所述卷积神经网络模型包括嵌入层、卷积层、池化层和输出层;

所述嵌入层用于把一个用户u对一个项目i的评论文本D转化成一个数字矩阵,通过连接评论中的词向量来把文本表示为一个矩阵,其中词向量是随机初始化或者用预训练的词嵌入模型进行初始化,生成的初始化词向量矩阵为X={x1,x2,...,xs},其中X∈Rd×s,xi∈Rd表示词向量,d为词向量的维度,s为评论的长度;当遇到未包含的词,则赋予d维正态分布的随机向量,其中xi表示输入的文本中第i个词的词向量;

所述卷积层用于提取输入文本的上下文特征,输入文本中第i个词的上下文特征表示为fij∈R,所述上下文特征的特征值通过卷积层中滑动窗口内的第j个共享权重参数计算获得,其中ws表示滑动窗口的大小,ws值决定了所述卷积神经网络模型在提取第i个词的特征时,其上下文中所包含词的数量;卷积层的工作方式如式(1)所示:其中,*表示在卷积层计算中的卷积操作,即滑动窗口内的第j个过滤函数对其在窗口内的ws个词向量进行非线性并行处理; 为偏置向量;h函数表示一个非线性激活函数;

所述池化层用于提取隐藏特征,从隐藏特征中提取分布式表示,并且通过池化操作来将文本特征向量长度固定到一个定长的特征向量中;所述池化层使用max-pooling作为池化操作,通过从每个上下文特征向量fj中提取最大值,将所述评论信息的最终表示转化为一个长度为nf的表示向量,具体操作如式(2)所示:nf=[max(f1),max(f2),...,max(fnf)]  (2)

其中,fj是通过卷积层中滑动窗口内的第j个共享权值 计算获得的输入文本的上下文特征向量;

所述输出层使用非线性映射函数生成评论文本潜在特征,具体过程如式(3)所示:

其中, 和 表示映射矩阵, 和 表示偏置向量;最终生成的隐藏特

征向量为a∈Rk,向量的每一项表示一个用户对一个项目的喜好程度值的概率,每个向量选取概率最大的值对应的数作为该用户对该项目的喜好程度值。

5.如权利要求4所述的基于卷积神经网络与降噪自编码器的信息推荐方法,其特征在于,所述卷积神经网络模型对评论文本的处理过程表示为cnn函数,用户u对项目i的评论文本信息的隐藏特征的计算表示成式(4)。

其中,Xui表示用户u对项目i的评论文本, 表示用户u对所有项目的喜好程度值所构成的向量。

6.如权利要求5所述的基于卷积神经网络与降噪自编码器的信息推荐方法,其特征在于,步骤二中的所述降噪自编码器模型用于将用户u的含有噪声版本的所述评分信息和所述信任信息的数据结合所述卷积神经网络模型的输出结果分别输入三个降噪自编码器模型中,对其进行并行处理,分别学习其潜在用户偏好,通过编码和解码过程,输出最终的评分、信任和评论数据的预测向量;所述噪声采用高斯噪声或者drop-out噪声,所述噪声用于防止数据的过度拟合;

所述降噪自编码器模型进一步用于使隐藏层发现更多鲁棒性的特征,并且防止简单学习恒等函数;含有噪声的输入来自于条件分布 在使用drop-out噪声的情况下,以概率q去擦除原始矩阵,将每个值都随机置0;对于每一个项目x的输入R、T和X,相应的有噪声版本 定义可以表示成式(5)和(6),其中,q是随机drop out一个单位的概率;δ表示噪声的偏置;为了使得噪声无偏,设置有噪声的输入是原始值的 倍。

7.如权利要求6所述的基于卷积神经网络与降噪自编码器的信息推荐方法,其特征在于,所述降噪自编码器模型包括编码层、权重层和解码层;

所述编码层用于将评分、信任和评论数据输入映射到低维空间,编码层可以表示成式(7)、(8)和(9),其中, 分别表示用户u评分、信任和评论数据的有噪声版本; 分

n

别表示从评分数据、信任数据和评论数据中学习的u的潜在用户偏好;维数为k的参数W∈R×k,V∈Rm×k,H∈Rn×k,b∈Rn×1,c∈Rm×1,d∈Rn×1被用来训练去学习用户偏好;f(·)是一个element-wise映射函数,该映射函数包括恒等函数f(x)=x或sigmoid函数所述权重层用于将评分、信任和评论数据进行加权整合,以得到建模用户的偏好,具体过程表示成式(10), 其中,Pu表示用户u的综合用户偏好;α,β是平衡 之间的影响的超参数;

所述解码层用于从噪声数据中重构原始输入数据,评分、信任和评论数据的定义表示成式(11)、(12)和(13),其中, 为每个用户u的评分、信任和评论数据的预测值;参数W′∈Rn×k,V′∈Rm×k,H′∈Rn×k,b′∈Rn×1,c′∈Rm×1,d′∈Rn×1被训练用来重构输入;g(·)是一个element-wise映射函数。

8.如权利要求7所述的基于卷积神经网络与降噪自编码器的信息推荐方法,其特征在于,步骤三中的所述推荐列表通过加权合并方式对用户u进行相应地推荐,在所述上下文特征向量和平衡用户偏好的超参数的基础上,生成最终推荐结果的过程可以表示成式(14),其中,Qu表示用户u的推荐用户偏好;α,β是平衡 之间的影响的超参数。

9.一种基于卷积神经网络与降噪自编码器的信息推荐的实现系统,其用于实现如权利要求1-8任一项所述的基于卷积神经网络与降噪自编码器的信息推荐方法,其特征在于,该实现系统包括:用户数据信息分析模块,用于对与用户相关的评分信息、信任信息和评论信息进行分类和过滤;

卷积神经网络模型模块,用于对用户的评论信息做出初步的处理,提取文本的隐藏特征矩阵,并最终得到用户对所有项目的隐藏特征向量;

降噪自编码器模型模块,通过在原始的输入数据中加入噪声,以增加自身编码和重构数据时的难度,通过一个狭窄的神经网络,从其噪声版本重构干净的输入数据,获得更加准确的特征表示;

信息融合推荐模型模块,将三个并列的降噪自编码器模型模块输出的与评分信息、信任信息和评论信息相应的预测向量进行加权融合,生成目标用户的推荐列表。

10.如权利要求9所述的基于卷积神经网络与降噪自编码器的信息推荐的实现系统,其特征在于,所述卷积神经网络模型模块包括嵌入层模块、卷积层模块、池化层模块和输出层模块;所述降噪自编码器模型模块包括编码层模块、权重层模块和解码层模块;

所述嵌入层模块用于将用户对项目的评论文本转换为数字矩阵;

所述卷积层模块用于提取所述评论文本的上下文特征,并生成上下文特征向量;

所述池化层模块用于将所述上下文特征向量固定到一个定长的特征向量中;

所述输出层模块用于使用非线性映射函数生成所述评论文本的潜在特征;

所述编码层模块用于将评分信息、信任信息和评论信息输入并映射到低维空间;

所述权重层模块用于根据评分信息、信任信息和评论信息的非线性相关性,对所述评分信息、所述信任信息和所述评论信息进行加权融合;

所述解码层模块用于从噪声数据中重构原始输入数据,并输出所述评分信息、所述信任信息和所述评论信息的数据预测值。