欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2021101966724
申请人: 山东师范大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-01-05
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于知识图谱和强化学习的电影推荐方法,其特征是,包括如下步骤:获取电影网站的日志数据,提取特征参数数据以及基于知识图谱提取知识特征;

将提取的参数数据以及知识特征传输至训练好的Wide&Deep模型进行个性化召回,获得候选集;

对候选集的数据进行个性化排序,对候选集中的数据进行评分,输出电影点击率,将点击率高于设定阈值的电影作为推荐结果;

采用强化学习优化deep模型的输入向量,优化推荐结果。

2.如权利要求1所述的一种基于知识图谱和强化学习的电影推荐方法,其特征是:电影网站的日志数据包括:地址、日期、电影名称、电影类别、演员、是否评分、评分值和查看简介的次数;

所述候选集的数据包括wide模型的预测电影类别的概率以及deep模型得到的候选集向量;

或者,通过电影特征参数数据构建电影语料库,如下:获取特征参数数据,包括对应网站的电影属性特征以及用户特征获取的特征;通过embedding处理,用密集向量表示,获得语料库。

3.如权利要求1所述的一种基于知识图谱和强化学习的电影推荐方法,其特征是:基于知识图谱提取知识特征的方法,包括如下步骤:识别电影名称和简介中的实体并用实体链接方法消除歧义;

根据设置的知识图谱结构,将识别后的实体链接在一步之内形成子图;

利用基于距离的翻译模型得到子图中每个实体的Embedding向量。

4.如权利要求1所述的一种基于知识图谱和强化学习的电影推荐方法,其特征是:所述Wide模型因子分解机模型,包括特征输入层、调制层以及输出单元,其中调制层采用因子分解机进行调制;

或者,所述deep模型采用DNN网络。

5.如权利要求1所述的一种基于知识图谱和强化学习的电影推荐方法,其特征是:通过deep模型得到候选集向量的识别方法,具体为:将知识特征中的参数特征本身的embedding向量和参数特征的实体embedding向量进行拼接;

将网站中的电影按照用户的历史操作进行分类;

在deep模型的DNN网络输入层之后的隐层采用注意力机制,将网站中的电影进行权重计算后传输至下一层;

将注意力机制评分计算后带有不同权重的电影向量进行relu操作,得到Deep模型部分的候选集向量。

6.如权利要求1所述的一种基于知识图谱和强化学习的电影推荐方法,其特征是:对候选集的数据进行个性化排序的方法为:融合wide模型的预测电影类别的概率以及deep模型得到的候选集向量,输出电影点击率方法,具体为:将wide模型的输出概率值进行排序,得到排序靠前的前k部电影;

排序后的前k部电影的embedding向量与对应该电影的deep模型得到的候选集向量以加权的方式合并到一起;

将所得结果经过sigmod函数进行激活,得到用wide模型和deep模型之后所计算出的电影点击率。

7.如权利要求1所述的一种基于知识图谱和强化学习的电影推荐方法,其特征是:Wide&Deep模型训练过程,包括如下步骤:获取包括已知用户历史行为的电影网站日志数据,提取特征参数数据以及基于知识图谱提取知识特征;

构建Wide&Deep模型,将特征参数数据以及知识特征数据传输至Wide&Deep模型进行识别,分别获得wide模型的预测电影类别的概率以及deep模型得到的候选集向量;

融合wide模型的预测电影类别的概率以及deep模型得到的候选集向量,输出电影点击率,将点击率高于设定阈值的电影作为推荐结果,计算推荐结果与用户实际行为的推荐偏差,修正模型参数,获得训练好的Wide&Deep模型;

根据用户的活跃度反馈信息优化deep模型的输入向量。

8.如权利要求1所述的一种基于知识图谱和强化学习的电影推荐方法,其特征是:根据用户的活跃度反馈信息优化deep模型的输入向量,包括如下步骤:获取用户的活跃度反馈信息,包括用户的意图和所处场景;

考虑长期收益对当前决策的影响,以List‑Wise粒度对电影推荐列表进行调整;

获取用户根据调整后的推荐列表的反馈,通过个性化召回算法获得用户对电影的点击率和观看率,来调整Deep模型不同类电影的注意力权重。

9.一种基于知识图谱和强化学习的电影推荐系统,其特征是,包括:获取模块:被配置为用于获取电影网站的日志数据,提取特征参数数据以及基于知识图谱提取知识特征;

候选集构建模块:将提取的参数数据以及知识特征传输至训练好的Wide&Deep模型进行个性化召回,获得候选集;

排序模块:被配置为用于对候选集的数据进行个性化排序,对候选集中的数据进行评分,输出电影点击率,将点击率高于设定阈值的电影作为推荐结果;

优化模块:被配置为用于采用强化学习优化deep模型的输入向量,优化推荐结果。

10.一种计算机可读存储介质,其特征是,用于存储计算机指令,所述计算机指令被处理器执行时,完成权利要求1‑8任一项方法所述的步骤。