1.一种基于对抗生成网络的微博话题推送方法,其特征在于,所述方法包括:微博服务器内的每个用户都通过通信组件接入到运算服务器中,获取微博社交网络中微博话题的互动数据;
通信组件接收到互动数据后,从该互动数据的源地址或者目的地址中解析出用户属性;
运算服务器采用无监督的对抗生成网络对互动数据以及用户属性增强,预测出参与用户的粉丝即潜在参与用户在下一时刻参与该微博话题的概率值;
步骤1)通过通信组件获取所有用户历史行为数据、与其转发用户的交互数据以及用户自身属性数据,并统计影响用户转发行为的所有数据;
步骤2)利用对抗生成网络GAN对步骤1)中所获取的数据进行增强;
步骤3)利用步骤2)增强后的数据量化微博话题传播过程中影响用户传播的因素;
步骤4)利用步骤3)量化后的影响因素和逻辑回归模型训练各个影响用户传播的因素的权值,直至完成该转发预测模型的训练;
步骤5)输入下一时刻潜在用户历史行为数据,与转发用户的交互数据以及潜在用户自身属性数据,通过步骤4)训练好的转发预测模型,输出该潜在用户在下一时刻参与该微博话题的概率;
其中,用户历史行为数据包括发表微博数、转发微博数;与其转发用户的交互数据包括与转发用户点赞数,评论数,转发历史微博行为;潜在用户自身属性数据包括用户的关注数和粉丝数;
将阈值区间发生器产生的多个不同大小的阈值分别与概率值进行比较,确定潜在参与用户对于该微博话题的可能感兴趣程度;
基于潜在参与用户的可能感兴趣程度,通过控制通信组件向该潜在参与用户推送该微博话题。
2.根据权利要求1所述的一种基于对抗生成网络的微博话题推送方法,其特征在于,所述通信组件接收到互动数据后,从该互动数据的源地址或者目的地址中解析出用户属性包括:在参与微博话题的互动数据中,将其中的源地址和目的地址对应的用户作为已参与微博话题的用户;
在其他的互动数据中,将其中的源地址和目的地址对应的其他用户作为未参与微博话题的用户。
3.根据权利要求1所述的一种基于对抗生成网络的微博话题推送方法,其特征在于,所述步骤2)包括:步骤21)搭建两个神经网络模型,包括生成模型G和判别模型D;
步骤22)将生成模型G和判别模型D构成了一个动态的博弈过程,从而生成对抗网络;
步骤23)基于纳什均衡的优化目标,训练对抗网络模型;
步骤24)生成模型产生与采集的微博话题样本同态同分布的数据以及大量统计影响用户转发行为的数据。
4.根据权利要求1所述的一种基于对抗生成网络的微博话题推送方法,其特征在于,所述步骤3)中影响用户传播的因素包括:用户活跃度:
activity(vj)=θ1×count[origNum(vj)]+θ2×count[retwNum(vj)];
用户自身因素:
selfFactor(vj)=activity(vj)+θ3×countofFans(vj)+θ4×countofIdol(vj)+θ5×countofIHU(vj);
用户交互度:
其中,count[origNum(vj)]表示用户vj在微博话题开始前一个月的原创微博数;count[retwNum(vj)]表示用户vj在微博话题开始前一个月的转发微博数,countofFans(vj)表示用户vj的粉丝数;countofIdol(vj)表示用户vj的关注数,countofIHU(vj)表示用户vj关注的参与用户的个数;Iij为指示函数,即: K为参与用户发布的微博总数;interact(blogkb)表示潜在用户基于行为b参与了谣言或辟谣话题用户的第k条微博;θ1表示原创微博数权值;θ2表示转发微博数权值;θ3表示粉丝数权值;θ4表示关注数权值;θ5表示参与个数权值;θ6表示潜在参与用户的参与权值;θ1,θ2,θ3,θ4,θ5,θ6∈[0,1]。
5.根据权利要求4所述的一种基于对抗生成网络的微博话题推送方法,其特征在于,所述预测模型的训练包括构建出基于逻辑回归的预测模型,对影响用户传播的因素的权值进行训练,直至训练完成预测模型;
基于逻辑回归的预测模型表示为:
影响用户转发因素函数为:
T
其中,P(r|x)表示输入x时预测出潜在参与用户点赞、评论或/和转发的概率;θ表示各T个影响因素权值的集合,θ={θ1,θ2,θ3,θ4,θ5,θ6};x表示输入的潜在用户的历史行为因素、与话题参与用户的交互行为因素以及自身因素。
6.根据权利要求1所述的一种基于对抗生成网络的微博话题推送方法,其特征在于,所述阈值区间发生器产生至少五个阈值,其中最大的为1,最小的为0,划分出四个可能感兴趣程度。