欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2020115563372
申请人: 东北电力大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2023-12-11
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于信息传播特点的虚假舆论识别系统,其特征在于,包括:(1)数据采集和数据库管理模块:进行数据采集、数据分类和数据预处理,构建社交网络虚假舆论识别本体数据库,包括数据采集装置、数据分类装置、数据预处理装置:

1)所述数据分类装置对采集数据进行类别的划分,包括两类:a、用户的属性数据:用户编号ID,用户的昵称n,用户的年龄y、用户的职业x、用户的喜好h;

b、用户的行为数据:用户的点赞量NL、转发量NF和评论数据NC;

2)所述数据预处理装置设置为:

a、构建虚假舆论字典L={TC,SW},其中TC是话题类别,SW是主题词,使用one‑hot编码函数Vector将所述用户属性数据和行为数据向量化,用户属性向量UV=Vector(y/100(NC+n+x+h)),虚假舆论词典向量DV=Vector(TC+SW),定义pij表示用户i对用户j的影响力,采用公式

b、根据用户的行为数据,提取用户之间的互动关系,用于构建社交网络图模型;

(2)虚假舆论影响力传播计算模块:根据用户的行为数据结合信息传播特点构建虚假舆论影响力传播模型,包括图模型构建装置和虚假舆论影响力传播的计算装置:

1)所述图模型构建装置设置为:以预处理的数据为基础,分析数据中用户的互动关系,提取出社交网络图数据结构,将社交网络抽象为图模型,用户表示为图中的节点V={v1,v2,v3,...,vn},用户之间的联系表示为图中的边E={eij},并且(i,j)={1,2,3,...,n},P={Pij}表示边eij的权值,用户之间的互动关系用节点的出度D={dv1,dv2,dv3,...,dvn}表示,社交网络图模型G={v1:{v2:p12,v3:p13},v2:{v5:p25,v3:p23,v9:p29,…},…};

2)所述虚假舆论影响力传播计算装置为:a、设定每个用户的激活阈值θv={I(v),Nin(v)},其中I(v)为节点v的入度,Nin(v)为节点v的入度节点集合,每个用户的激活阈值计算采用公式b、设定每个用户的影响力传播激活转态P={v,u,puv},其中v表示待激活的用户节点,u表示已经激活且对用户v有影响力的用户,puv表示用户u影响到用户v的可能性,puv∈[0,

1],社交网络中每一个用户被激活,即参与到某一热点事件讨论中的计算公式为(3)用户分群模块:根据虚假舆论信息的传播特点,将社交网络中的用户分为不同的聚集性群体,挖掘出每个用户群体中的影响力最大个体,包括用户群体挖掘装置和群体内部影响力最大化用户挖掘装置:

1)所述用户群体挖掘装置设置为:用Rq表示用户群体,其中q={1,2,...,w},w表示用户群体数量,该装置内部通过图模型计算的用户群体指标公式为: 其中vi满足 vi∈V,并且 r为参与话题讨论的最小用户数;

2)所述影响力最大化用户挖掘装置设置为:a、读取用户分群数据,构建社交网络图模型;

b、设定用户影响力增益量化指标ΔG(vi)={S,vi},其中S为已知有较大影响力的种子用户,初始化为Φ节点集合,v为某一待计算影响力的用户节点,采用公式其中,为干扰因子,为消除在不同硬件环境下的计算误差,种子集影响力增益采用公式c、设定用户影响力增益计算成本指标 t是采集到的ΔG(vi)的计算成本,其中,β为干扰因子,为消除在不同硬件环境下的计算误差,种子集影响力计算成本采用公式

d、设定影响力最大用户挖掘条件B(S)={S,vi},其中S为已知有较大影响力的种子用户,初始化为Φ节点集合,vi为某一待计算影响力和时间成本的用户节点,采用公式(4)虚假舆论识别模块:将虚假舆论信息传播规律和虚假舆论信息的特征进行综合分析和准确识别,包括虚假舆论预测装置:所述虚假舆论预测装置设定虚假舆论拟合参数ρ={vt,St,v,S},其中vt是对于某一新的热点事件通过上述步骤计算的影响力最大个体,St是vt集合,需要保证St≥B(S),v表示系统已学习到的影响力最大个体,S是v的集合,需要保证S≥B(S);len(St)表示集合St元素数量,采用公式 当ρ≥0.5时,认为该热点事件是虚假舆论,该阈值依据实际情况自行调整。

2.如权利要求1所述的一种基于信息传播特点的虚假舆论识别系统,其特征在于,所述数据采集装置通过手机、电脑、可穿戴设备采集基于社交网络用户的属性数据和行为数据。

3.一种利用权利要求1所述的基于信息传播特点的虚假舆论识别系统的处理方法,其特征在于,具体步骤如下:

步骤1:将采集的数据进行分类;

步骤2:针对不同的数据类型进行数据预处理;

步骤3:根据预处理数据构建社交网络图模型,分析数据中用户的互动关系,提取出社交网络图数据结构;

步骤4:计算每个用户的激活阈值θv;

步骤5:计算每个用户的影响力传播激活转态P;

步骤6:根据用户之间的互动关系计算用户分群指标Rq;

步骤7:基于用户分群结果,计算每个用户群体中用户影响力增益量化指标ΔG(vi);

步骤8:计算用户影响力增益计算成本指标ΔC(vi);

步骤9:计算影响力最大用户挖掘条件B(S);

步骤10:计算虚假舆论拟合参数ρ,当ρ超过设定阈值时,认为该热点事件是虚假舆论。