欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2019110983844
申请人: 重庆邮电大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-02-26
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于三元关联图的社交话题影响力识别方法,其特征在于,包括以下步骤:

S1、利用网络爬虫和/或各种社交软件提供的API接口获取数据源,获取的数据包括:热点话题数据和参与用户行为属性数据;

S2、根据获取的数据源提取热点话题的传播路径以及参与用户的所属领域信息,构建路径‑用户‑领域三元关联图模型;

S21、根据获取的数据源提取热点话题的传播路径和参与用户的所属领域信息,根据热点话题每条传播路径的节点信息构建路径‑用户二元关联图模型;

S22、根据重叠社区划分算法将热点话题参与用户划分成不同的社团,构建用户‑领域划分模型:

S221、在重叠社区识别算法Copra算法的基础上,根据参与用户之间的好友关系,将所有参与热点话题传播的用户划分到不同的社团中,得到每个社团的参与用户集合;

S222、根据社团内参与用户的标签信息、参与用户兴趣爱好和擅长领域,以投票方式统计该社团内各个领域类别出现的次数,按照“少数服从多数”的投票原则,将得分最高的领域类别作为该社团的领域类别Dk,将该社团的参与用户集合作为该领域类别的用户集合Um;

S223、对每个社团进行步骤S222的处理,从而构建一种用户‑领域划分模型;

S23、在路径‑用户二元关联图模型、用户‑领域划分模型基础之上,构建路径‑用户‑领域三元关联图模型;

根据路径‑用户二元关联图模型和用户‑领域划分模型,以传播路径、参与用户和传播领域为三个关键元素,将热点话题传播网络划分成三个互不相交的子集P、U与D,其中,两组元素节点之间的连边关系作为权重矩阵A和权重矩阵B,完成热点话题传播网络的路径‑用户‑领域三元关联图模型的构建,该三元关联图模型用GT={P∪U∪D,A∪B}表示,其中,P为话题传播网络中传播路径的集合,U为话题传播网络中参与用户的集合,D为话题传播网络中传播领域的集合,A为传播路径与参与用户之间的权重矩阵,B为参与用户与传播领域之间的权重矩阵;

S3、利用元素节点序列的初始得分向量和相互之间的权值矩阵,在路径‑用户‑领域三元关联图模型上进行正反迭代投票来挖掘出热点话题传播的关键元素节点信息:S31、计算三元关联图模型中各节点初值:在T阶段内,对传播路径的重要程度、传播领域的流行度以及参与用户的影响力度进行计算,得到传播路径、参与用户与传播领域所对应的初始得分向量X0、Y0和Z0;

S32、在三元关联图上进行正反迭代投票,识别出关键元素的最终得分向量:根据权重矩阵A、权重矩阵B、传播路径、参与用户与传播领域所对应的初始得分向量X0、Y0和Z0,采用正反迭代投票机制进行迭代,当本次迭代后X'的模与上一次迭代后X的模之差小于阈值ε时,迭代过程终止,并返回传播路径、参与用户与传播领域所对应的最终得分向量X'、Y'和Z',得到关键元素节点信息;

S4、根据关键元素节点信息,利用时间切片的方法,对完整生命周期内热点话题的传播过程进行动态演绎;

S5、将完整生命周期内热点话题传播的关键用户和关键领域的动态演绎过程存储到话题管理服务器,通过话题管理服务器将热点话题的动态演绎完整过程传送给网络话题监管中心或网络话题监管部门,并进行可视化展示,辅助监管部门精准与实时地对热点话题传播趋势进行监督、控制、引导与清理需求。

2.如权利要求1所述的一种基于三元关联图的社交话题影响力识别方法,其特征在于,所述热点话题数据包括:热点话题下的参与用户ID、参与用户转发内容及数目、参与用户评论内容及数目;所述参与用户行为属性数据包括:参与用户兴趣爱好、参与用户擅长领域、参与用户标签信息、参与用户好友关系及数目、参与用户转发数、参与用户评论数目。

3.如权利要求1所述的一种基于三元关联图的社交话题影响力识别方法,其特征在于,路径‑用户二元关联图模型的构建包括以下步骤:S211、将话题的发起者作为根节点,每一个转发用户作为一个子节点,每一次的转发行为看作参与用户之间的一条边,构建话题传播树模型,以根节点为起点,叶子节点为终点,确定热点话题的每条传播路径;

S212、根据热点话题每条传播路径中的节点行为信息构建用户‑路径二元关联图模型。

4.如权利要求1所述的一种基于三元关联图的社交话题影响力识别方法,其特征在于,所述正反迭代投票机制包括正向迭代投票和反向迭代投票两个步骤,正向迭代投票和反向迭代投票交替进行,当本次迭代后X'的模与上一次迭代后X的模之差小于阈值ε时,迭代过程终止,并返回X'、Y'、Z';每完成一轮反向投票过程,对该机制中的传播路径、参与用户和传播领域的得分向量分别进行一次归一化处理。

5.一种基于三元关联图的社交话题影响力识别装置,该装置用于执行权利要求1~4所述的任一种基于三元关联图的社交话题影响力识别方法,其特征在于,包括:数据采集模块,用于从网页中采集数据源;

数据预处理模块,用于对采集的数据进行简单清洗,并将预处理后的数据输入到动态演绎模块中;

动态演绎模块,用于对输入的数据进行路径‑用户‑领域三元关联图建模处理和正反迭代机制处理对热点话题传播过程进行动态演绎,识别出该热点话题的关键用户、关键路径、关键领域;

输出模块,所述输出模块与话题管理器连接,输出模块用于将完整生命周期内热点话题传播的动态演绎过程、关键用户、关键路径和关键领域存储到话题管理服务器,通过话题管理服务器将热点话题的动态演绎完整过程传送给网络话题监管中心或网络话题监管部门,采用可视化设备进行可视化展示。