欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2020107342414
申请人: 九江学院
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2023-12-11
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种用于视频推荐且基于LDA的深度学习模型构建方法,其特征在于,首先获取大量视频文本信息,并对获取的视频文本信息进行分析整理为一个视频整体文档D,再通过LDA模型对视频整体文档D中的词汇关联进行LDA主题模型建模,由LDA主题模型预测出视频-主题概率分布矩阵表,而后根据视频-主题概率分布矩阵表对所有视频进行聚类分析,以预测出所需视频的用户兴趣主题集;最后在神经协同框架中的隐层前加入pairwise-pooling操作以捕获建模用户与其兴趣主题集ITS、建模视频与其属性主题集ATS之间高阶关联,通过不断迭代更新训练后,获得基于LDA的深度学习模型。

2.根据权利要求1所述的一种用于视频推荐且基于LDA的深度学习模型构建方法,其特征在于,具体步骤如下:

1)预测视频-主题概率分布矩阵表

通过网络爬虫获取大量视频文本信息,并对获取的视频文本信息进行分析整理为一个视频整体文档D,并引入视频词典Dic_Iws、干扰词典Dic_Uws、特征词Fw及特征词集Fws,而后将视频词典Dic_Iws、干扰词典Dic_Uws添加至jieba自定义词典中进行分词操作,依次清理jieba分词结果中的干扰词以提取出Tas的特征词Fw,再将从视频整体文档D提取出所有的特征词Fw添加到该视频的特征词集Fws,即得到提取的特征词;

再通过LDA模型对视频整体文档D中的词汇关联进行LDA主题模型建模,并将从特征词集Fws提取出的特征词Fw作为LDA主题模型训练的语料,即可预测出每个视频的视频-主题概率分布矩阵表;

2)预测用户兴趣主题集

将通过LDA主题模型预测出的每个视频-主题概率分布矩阵表作为预测矩阵,并将该视频的每个主题预测的概率Wnk作为该主题所占的属性主题权重W1,设置阙值,以挑选出该视频的属性主题集ATS,而后利用已经预测出的属性主题集ATS和用户观看历史的交互视频集Ifs进一步预测出所需视频属性高阶关联,得每个用户的主题兴趣集ITS;

3)获得基于LDA的深度学习模型

构建主题样本集进行深度学习的训练,而后将进行过深度学习训练的主题样本集应用至神经协同框架中进行训练,并在神经协同框架中的隐层前加入pairwise-pooling操作,以在建模用户与其兴趣主题集ITS、建模视频与其属性主题集ATS之间建立成对关联,同时训练建模用户隐层中每一层的权重矩阵与偏置向量,进而计算建模用户未进行交互的视频预测评分值,当预测评分值低于预设值即结束这个过程,通过不断迭代更新训练后,获得基于LDA的深度学习模型。

3.根据权利要求2所述的一种用于视频推荐且基于LDA的深度学习模型构建方法,其特征在于,通过基于LDA的深度学习模型对用户、视频预测层的预测评分值排序,从而生成用于视频推荐的TOP-K推荐列表。

4.根据权利要求2所述的一种用于视频推荐且基于LDA的深度学习模型构建方法,其特征在于,步骤1)中,视频词典Dic_Iws由所有视频的标题和爬取的输入法中影视词汇构成;

干扰词典Dic_Uws由所有将影响到聚类效果的词典构成;特征词Fw由视频整体文档D中具有实体意义的词构成,特征词集Fws由视频的标题Ti、关键属性Kas、和经Ta分词后的集合构成。

5.根据权利要求2所述的一种用于视频推荐且基于LDA的深度学习模型构建方法,其特征在于,步骤3)中,建模用户与其兴趣主题集ITS的成对关系为:其中,u′为用户,ITSu′为用户兴趣主题集ITS的K维嵌入向量,|ITSu|为兴趣主题集的长度,⊙为两个逐元素相乘。

6.根据权利要求2所述的一种用于视频推荐且基于LDA的深度学习模型构建方法,其特征在于,步骤3)中,建模视频与其属性主题集ATS的成对关系为:其中,v为用户,ATSv为用户属性主题集ATS的K维嵌入向量,|ITSu|为兴趣主题集的长度,⊙为两个逐元素相乘。