欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2017113802606
申请人: 重庆邮电大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-02-23
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于隐链接分析热点话题传播趋势的系统,其特征在于,包括:数据获取模块、隐链接建立模块、影响力定义模块及动力学模型构建模块,其中数据获取模块,主要用于直接从基于web研究型的推荐系统下载或利用成熟的社交平台的应用程序编程接口获取数据,并对数据进行包括相应属性的预处理后发送给隐链接建立模块后,利用K‑近邻算法建立隐链接;

隐链接建立模块,主要用于提取相关属性,建立隐链接,从已有数据中提取用户之间标签相似度、相同话题、共同好友、文本相似性四个属性,利用K‑近邻算法,构建用户之间的隐链接,进而计算非好友之间的影响力;

影响力定义模块,用于根据个体驱动机制和好友驱动机制,分别用多个属性构成个体影响力和好友影响力两个因素定义热点话题传播的影响力,并利用多元线性回归模型,分析影响力;

动力学模型构建模块,用于把信息传播运用到动力学模型中,把影响力因子引入到动力学模型中,分析热点话题传播趋势;

所述动力学模型构建模块中定义影响力流程具体可分为两个步骤:S41:根据传染率λ不是一直不变的定值,是随时间和个人兴趣、爱好不断变换的,利用平均场理论,对传染率λ进行描述;

S42:分别利用隐链接的影响力和显链接的影响力构建SIR传染病模型,将影响力作为感染率引入到传染病模型中,动力学方程如下式(16)所示:其中λ1表示显链接的感染率,λ2表示隐链接的感染率,利用时间分片的方法,把每2个小时参与话题的人作为一个时间段分片,其中I(t)表示一个时间段分片中消息已知者的人数,S(t)表示一个时间段分片中消息未知者的人数,μ表示从消息已知者转换为消息免疫者的概率。

2.根据权利要求1所述的一种基于隐链接分析热点话题传播趋势的系统,其特征在于,所述数据获取模块抓取某三个热点话题下的转发或评论用户的信息,包括已参与话题讨论用户的粉丝信息。

3.根据权利要求1所述的一种基于隐链接分析热点话题传播趋势的系统,其特征在于,所述隐链接建立模块从已有数据中提取用户之间标签相似度、相同话题、共同好友、文本相似性四个属性,根据数据方面的特征对其进行修改,具体如下:

1)标签相似度tagsim(vi,vj):A表示用户vi的标签,B表示用户vj的标签,用Jaccard系数进行归一化计算,Jaccard系数越大,表示两个用户标签相似度越大;

2)相同话题comtopic(vi,vj)和共同好友comfriend(vi,vj)通过获取的数据直接统计出来;

3)文本内容相似性textsim(θ):textsim(θ)=cosθ   (2)式(2)中的余弦值cosθ的定义如下式(3)所示:将两个用户的发的微博的词,建立两个向量a,b,计算这两个向量的余弦值,就得到这两个用户的文本在统计学方法中他们的相似情况,其中(x1,y1)代表向量a的坐标,(x2,y2)代表向量b的坐标。

4.根据权利要求3所述的一种基于隐链接分析热点话题传播趋势的系统,其特征在于,所述隐链接建立模块根据计算出来的四个属性,结合主观赋权值法和客观赋权值法,给予四个属性合理赋权值,利用K‑近邻算法,设置k值,得到与好友属性极其相似的用户,建立隐链接,其算法步骤如下:

①从统计好的数据中随机选出3/4的数据作为训练集,1/4的数据作为测试集;

②设置k=6;

2 2 2 2

③根据公式dis=w1*(tr1‑te1)+w2*(tr2‑te2) +w3*(tr3‑te3)+w4*(tr4‑te4) ,其中w1+w2+w3+w4=1,tr代表训练集中的数据,te代表测试集中的数据,分别输入四个属性的值;w1、w2、w3、w4代表属性的权重;

④通过KNN算法,得到哪些用户之间可以建立隐链接;

⑤循环随机其他数据作测试集,直到所有数据集中的用户都有判断结果。

5.根据权利要求3所述的一种基于隐链接分析热点话题传播趋势的系统,其特征在于,所述影响力定义模块具体包括:

S31:使用多个相关属性定义个体影响力,个体影响力的定义如下式(8)所示:其中,ψij表示用户vi的属性,包括活跃用户、内容相似度和主动性个体驱动机制,maxv∈V(ψ(v))为归一化因子;

S32:使用多个相关属性定义好友影响力,好友影响力的定义如下式(14)所示:其中,ψij表示用户vi的好友属性,maxvεV(ψ(v))为归一化因子, 是半衰期函数,表示信息从发布到慢慢消亡的生命周期,其中,ti表示当前目标用户参与话题的时间,t′i表示好友参与话题的时间,w为正则化因子,w=1000;

S33:结合个体驱动机制和好友驱动机制定义影响力如下式(15)所示:Inf(vi)=γ0+γ1*indi(vi)+γ2*fri(vi)   式(15)其中,γ0、γ1、γ2表示偏回归系数,由多元线性回归模型训练拟合得出,其中indi(vi)表示个体影响力,fri(vi)表示好友影响力。

6.一种基于权利要求5所述系统的隐链接分析热点话题传播趋势的方法,其特征在于,包括以下步骤:

第一步:获取数据集,数据源的获取直接从现有的基于Web的研究型推荐系统下载或者利用成熟的社交平台的公共API获取用户的相关信息并进行包括数据分片在内的数据处理;

第二步:建立隐链接,从数据集中利用不同的方法分别计算出用户之间标签相似度、相同话题、共同好友、文本相似性四个因素,根据不同情况赋权值,构建隐链接;

第三步:定义影响力,利用个体驱动机制和好友驱动机制两个方面定义影响力,其中利用活跃用户、内容相似度、主动性三个属性定义个人驱动机制,说明驱动自身参与话题的因素;利用共同行为、好友相似性、好友推动力三个属性,说明周围好友驱动用户参与话题的因素,利用多元线性回归模型拟合个体驱动机制和好友驱动机制,分析影响力;

第四步:构建动力学模型,在传染病模型中,综合考虑信息传播的时效性和不确定性,引入平均场理论,得到一种基于社交影响力的信息传播模型;通过把影响力运用到传染病模型中,进而分析热点话题传播态势。