欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2020104311128
申请人: 苏州遐迩信息技术有限公司
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-11-21
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于神经网络的新闻推荐方法,其特征在于,该推荐方法的步骤为,S1、获取原有数据库内部分的新闻信息及所有的用户信息;

S2、利用FastText工具对获取的新闻信息中的标题与内容进行学习,获取固定长度的词向量并组成相应的词汇表;

S3、对数据库内获取的新闻信息按照不同的用户信息进行人工标注,人工标注的标准为是否为该用户已经阅读的新闻信息,已经阅读的新闻信息为阅读新闻信息,未被阅读的新闻信息为候选新闻信息;

S4、对获取的不同用户的阅读新闻信息与候选新闻信息,利用开源工具对标题与内容进行分词标注;

S5、将已经人工标注及分词标注的新闻信息组成新闻数据集,将获取的用户信息组成用户数据集,对新闻数据集及用户数据集进行整理和预处理,得到训练集与测试集,训练集由阅读新闻信息及用户信息组成,测试集由候选新闻信息与用户信息组成;

S6、利用步骤S5中训练集进行训练,得到新闻信息的推荐模型;

S7、在步骤S6生成的推荐模型中输入候选新闻信息,对候选新闻信息是否被用户点击进行概率的预测,得到测试集的精度;

所述步骤S6中训练的方法为,a、处理阅读新闻信息时,单篇阅读新闻信息用分词标注后的已经阅读的新闻标题和新闻内容的词向量求平均得到阅读新闻向量,使用卷积神经网络和注意力机制处理这些阅读新闻向量,得到阅读新闻向量的最终表示;b、处理用户信息时,用户信息包括用户自己感兴趣的新闻类别、用户朋友感兴趣的新闻类别、用户和朋友之间的亲密程度,这三种信息采用向量表示为信息向量,同一用户的这三种信息向量组成为用户社交向量,这三种信息向量开始为随机初始化,然后使用多层感知机和注意力机制对这三种信息向量进行处理,处理后再使用注意力机制对这三种信息向量进行处理得到最后的关于用户社交向量的最终表示;c、将步骤a中获取的阅读新闻向量的最终表示与步骤b中关于用户社交向量的最终表示使用注意力机制进行处理,得到用户的最终向量表示。

2.根据权利要求1所述的基于网络的新闻推荐方法,其特征在于,所述步骤S2中词向量的维度为50、100、128和200中的一种。

3.根据权利要求1所述的基于网络的新闻推荐方法,其特征在于,在所述步骤S3中阅读新闻信息人工标注为1,候选新闻信息人工标注为0。

4.根据权利要求1所述的基于网络的新闻推荐方法,其特征在于,所述的步骤S4中的开源工具为Jieba工具。

5.根据权利要求1所述的基于网络的新闻推荐方法,其特征在于,所述步骤S5中的训练集由9/10的新闻数据集的数据及用户数据集的数据组成,所述的测试集由1/10的新闻数据集的数据及用户数据集的数据组成。

6.根据权利要求1所述的基于网络的新闻推荐方法,其特征在于,所述的步骤S7中测试集的精度的测试方法为,首先,处理候选新闻信息时,单篇候选新闻信息用分词标注后的未阅读的新闻标题和新闻内容的词向量求平均得到候选新闻向量,使用卷积神经网络和注意力机制处理这些候选新闻向量,得到候选新闻向量的最终表示,之后计算候选新闻向量的最终表示与用户的最终向量表示的相似度获得用户点击候选新闻信息的概率。

7.根据权利要求6所述的基于网络的新闻推荐方法,其特征在于,计算相似度的方法采用基于欧几里得距离的相似度计算、基于余弦角度的相似度计算、基于Jaccard系数的相似度计算及基于皮尔森相关系数的相似度计算中的一种。

8.根据权利要求6所述的基于网络的新闻推荐方法,其特征在于,采用Adam来优化所有可训练参数,卷积神经网络的层数为2层,自我注意单元数设置为240,自我关注头的数量设置为10,词向量的选取维度为50、100、128和200中的一种。