1.一种基于会话噪声的滤波推荐方法,其特征在于,包括:对同一用户的原始会话序列进行聚类,得到若干个会话湖;
将已聚类的会话连成会话图,具体为:按顺序读取会话内部元素,对相邻元素在图内赋予一条边,最终得到亲密的会话湖图;
对会话图进行分割,舍弃分割后孤立的噪声点,具体为:把一个会话湖分割成t和v‑t两个子图,其中,v为原会话图的大小,t为候选会话湖的子数;计算每一个子图非亲密系数,根据非亲密系数与分裂系数的大小,确定相应的会话子图是否继续分割,直到所有的会话湖都递归地分割完成,将分割后孤立的节点视为噪声点,去除;
通过计算非亲密系数与分裂系数之间的大小来作为是否进行分割的标准,非亲密系数是由若干个已联结的会话子图内部的任意两点之间的距离来计算的,表现为会话图内边的权重;非亲密系数Ic的计算如公式X所示:其中,W1,W2为分割后的两个子图部分的点的个数,wk为连接两个会话湖的边的权重;
对于该分裂阈值的设置,选择根据图中点与边的关系来动态地确定分裂阈值;分裂阈值SC,用下式表示:其中,ε为当前会话子图中边的数目,v为当前会话子图中节点的数目;
计算剩余每一个会话图的潜在嵌入向量,所述嵌入向量输入门控图神经网络,得到用户的偏好信息;
同时获取每一个原始会话序列对应的嵌入向量,并进行建模,得到带有权重的用户偏好信息的隐藏状态;
采用GRU对会话的潜在嵌入向量进行建模,通过重置门决定上一时刻隐藏状态中的信息是否需要被遗忘;
GRU仅有两个门,分别是更新门和重置门,用下式来表示更新门Ut和重置门Rt:Ut=σ(XtWxr+Ht‑1Whr+br)
Rt=σ(XtWxz+Ht‑1Whz+bz)
其中,σ为sigmoid函数,取值为[0,1];
对于候选隐含状态和隐含状态,定义如下:
Ht=Ut⊙Ht‑1+(1‑Ut)⊙Ht
其中,⊙是Hadamard积,进行Hadamard乘积的意义就在于使用重置门决定在当前记忆内容中要遗忘多少上一时刻隐藏状态的内容;值接近于0说明该信息被遗忘,接近于1则保留该信息;隐含状态Ht使用更新门Ut来对上一隐含状态Ht‑1和候选隐含状态进行更新;
tanh为激活函数;
将用户的偏好信息与带有权重的用户偏好信息的隐藏状态进行合并,通过分类器得到每一个待推荐物品的潜在概率。
2.如权利要求1所述的一种基于会话噪声的滤波推荐方法,其特征在于,通过度量各会话序列之间的平移相似性,对会话序列进行聚类,具体为:构建会话s1和s2之间的距离矩阵;
根据s1和s2之间的最长公共子串设置偏置容忍量;
将距离小于偏置容忍量的会话对进行聚类,得到若干个会话湖。
3.如权利要求1所述的一种基于会话噪声的滤波推荐方法,其特征在于,所述非亲密系数根据分割后的两个子图部分的点的个数,以及连接两个会话湖的边的权重确定。
4.如权利要求1所述的一种基于会话噪声的滤波推荐方法,其特征在于,所述分裂系数根据当前会话子图中边的数目以及当前会话子图中节点的数目确定。
5.基于会话噪声的滤波推荐系统,用于实现如权利要求1‑4任一项权利要求所述的基于会话噪声的滤波推荐方法,其特征在于,包括:图组件和序列组件;所述图组件包括:会话聚类层,被配置为通过度量各会话序列之间的平移相似性,对会话序列进行聚类,得到若干个会话湖;
图分割层,被配置为将已聚类的会话连成会话图,并对会话图进行分割;
下降层,被配置为去除分割后的噪声点;
会话湖嵌入层,被配置为对于下降层所输出的若干子会话湖,计算每一个会话子图的潜在嵌入向量;
门控图神经网络层,被配置为根据接收到的嵌入向量,输出用户的偏好信息;
所述序列组件被配置为获取每一个原始会话序列对应的嵌入向量,并进行建模,得到带有权重的用户偏好信息的隐藏状态;
所述图组件的输出和序列组件的输出进入线性层进行合并后,通过分类器得到每一个待推荐物品的潜在概率。
6.如权利要求5所述的基于会话噪声的滤波推荐系统,其特征在于,所述序列组件包括:会话嵌入层,被配置为获取每一个原始会话序列对应的嵌入向量;
GRU层,被配置为对会话的潜在嵌入向量进行建模,输出带有权重的用户偏好信息的隐藏状态。
7.一种终端设备,其包括处理器和计算机可读存储介质,处理器用于实现各指令;计算机可读存储介质用于存储多条指令,其特征在于,所述指令适于由处理器加载并执行权利要求1‑4任一项所述的基于会话噪声的滤波推荐方法。
8.一种计算机可读存储介质,其中存储有多条指令,其特征在于,所述指令适于由终端设备的处理器加载并执行权利要求1‑4任一项所述的基于会话噪声的滤波推荐方法。