欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2019109905774
申请人: 陕西师范大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-01-05
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于层次注意力机制的POI推荐方法,所述方法包括如下步骤:S100:设计基于LSTM的解码器‑编码器的显式特征提取模型,用于从结构化数据中提取显式特征;

S200:设计基于NLP的注意力机制的隐式特征提取模型,用于从非结构化数据中提取隐式特征;

S300:使用文本相似度计算用户‑POI匹配度;

S400:使用softmax函数从所述显式特征和所述隐式特征中预测出初步POI推荐列表,再使用所述用户‑POI匹配度微调该初步POI推荐列表,得到最终POI推荐列表作为预测结果。

2.根据权利要求1所述的方法,优选的,步骤S100进一步包括:该显式特征提取模型包括了局部注意力机制和整体注意力机制,其中,所述局部注意力机制提取某一时刻用户的每一个特征对预测结果的重要程度,所述整体注意力机制提取某一时刻用户的整体特征对预测结果的重要程度,最终该显式特征提取模型从结构化数据中提取出显式特征向量

3.根据权利要求1所述的方法,步骤S200进一步包括:该隐式特征提取模型首先使用全连接层从用户签入数据文本的上下文中提取隐藏特征,再使用softmax函数计算注意力权重,最后通过考虑该注意力权重将输入的用户评论和POI描述转换为带注意力权重的用户隐式特征向量和POI隐式特征向量

4.根据权利要求1所述的方法,步骤S300进一步包括:S301:单词权重计算;

S302:文本相似度计算;

S303:通过上述步骤最终得到用户u对所有POI列表的相似度集合Su。

5.根据权利要求1所述的方法,步骤S400进一步包括:S401:将所述显式特征向量以及隐式特征向量和合并成整体特征向量v;

S402:将整体特征向量v输入全连接层的ReLU单元,得到加权后的整体特征向量v’,具体为:v′=ReLU(vW′+b′)

其中,v为整体特征向量,W’和b’为全连接层的参数,ReLU为线性整流函数,为拼接操作;

S403:使用softmax函数对所述加权后的整体特征向量v’进行归一化操作,得到了POI列表的概率分布:y′i=tanh(v′W"+b"),i=1,2,…,N其中,W”和b”是模型可以学习到的超参数,N为POI列表的最大长度;

S404:对yi′进行排序之后得到初步POI推荐列表:S405:使用用户u对所有POI列表的相似度集合Su作为影响权重对yi′进行微调。

6.根据权利要求5所述的方法,步骤S405进一步包括:首先,使用非线性的方式将权重映射到一个合适的阀值Ws,再将该阀值Ws以加法的方式微调yi′得到最终的POI列表概率分布y,具体为:Ws=tanh(SuWo+bo)y=y′+Ws,y′=[y′1,…,y′1,…,y′N]其中,Wo和bo是模型可以学习到的超参数,Su为用户u对所有POI列表的相似度集合,tanh为双曲正切函数;

其次,将最终的POI列表概率分布y进行排序,则前K个POI就组成了某个用户当前时刻t的最终POI推荐列表。

7.根据权利要求2所述的方法,其中,局部注意力机制进一步包括:假设${x_{i:t}}$为时刻t的第i个特征,则有:xt=(x1:t,x2:t,…,xi:t)将当前时刻的表达特征向量X1:t、、上一时刻编码器的内部特征和外部特征ht‑1输入加性模型进行运算之后,得到重要程度过程如下:其中,特征个数k为Xt的维度,Vi、bi、Wi和Ui是可以学习的参数;

再使用softmax函数进行正则化后得到Xt的注意力权重为最后根据和X1:t计算出局部特征向量:

8.根据权利要求2所述的方法,其中,整体注意力机制进一步包括:首先使用加性模型构造注意力打分函数:

其中,Vj、bj、Wj和Uj是模型可以学习到的超参数,为注意力分布,为Vj的转置操作;

其次,使用卷积神经网络对Xt进行降维和合并,得到模型的输入数据之后再使用softmax函数来完成注意力分布的计算过程:最后根据和计算全局特征向量

9.根据权利要求4所述的方法,步骤S301进一步包括:使用TF‑IDF算法计算时刻t的用户评论rt的第i个单词在第n个POI的描述gn中的权重其中,(g1,g2,…,gn,…,gN)为所有POI的描述的集合,N是POI列表的个数;TF( )为词频函数,用于分析用户评论的各个单词在拟对比的POI的描述中出现的次数;DF( )为反文档频率函数,用于计算包含了用户评论的各个单词在所有POI描述集合中出现的次数。

10.根据权利要求4所述的方法,步骤S302进一步包括:取rt和gn的前q个有代表性的关键词,表示为rq