1.一种基于潜在传播集的社交网络信息传播跟踪方法,其特征在于,包括以下步骤:步骤S1、在传统SIR模型中加入潜在传播节点PS类节点,建立基于潜在传播集的SIR模型;
步骤S2、从社交网络中获取网络消息并进行聚类,划分其消息类型,根据消息类型进行分组;每一组中的消息再按照当前热度排序,建立网络热点消息的分类数据库;
步骤S3、从建立的网络热点消息的分类数据库中选取网络热点消息,对社交网络进行采样,获取所选取的网络热点消息的基于潜在传播集的SIR模型的传播参数;
步骤S4、对社交网络进行监测,定时获取新的网络热点消息,将其与网络热点消息的分类数据库进行对比,选择最接近的网络热点消息类型,并提取步骤S3中获取的传播参数作为新的网络热点消息的基于潜在传播集的SIR模型的参考传播参数;
步骤S5、对获得的参考传播参数进行调整,进一步预测所述网络热点消息的传播情况;
步骤S6、根据所述网络热点消息的传播情况,对其传播进行人工干预。
2.根据权利要求1所述的方法,其特征在于,步骤S3中所述对社交网络进行采样进一步包括:以指定信息作为输入,从社交网络的服务器中爬取所述指定信息的不同用户状态的用户数据。
3.根据权利要求2所述的方法,其特征在于,所述用户状态包括:是否转发了相应热点消息;邻居中是否有用户转发了相应热点消息;转发的热点消息是否再次被其邻居转发。
4.根据权利要求3所述的方法,其特征在于,根据所述用户状态确定S、I、R、PS四类的数量,定时进行爬取统计。
5.根据权利要求4所述的方法,其特征在于,根据社交网络的网络拓扑结构和定时统计获得的S、I、R、PS四类用户的数量变化情况和步骤S1中建立的基于潜在传播集的SIR模型,反推传播参数β和γ。
6.根据权利要求1所述的方法,其特征在于,通过对新的网络热点消息提取关键词,判断其关键词在搜索引擎中的被搜索次数,与其所划分到的消息类型中的热点消息的关键词的被搜索次数进行比较,根据两者被搜索次数的比例关系,对步骤S4中获得的参考传播参数进行调整。
7.根据权利要求6所述的方法,其特征在于,所述步骤S5进一步包括,根据调整后的参考传播参数,结合步骤S1中建立的加入潜在传播节点PS后的SIPR模型进行仿真。
8.根据权利要求1所述的方法,其特征在于,所述步骤S6进一步包括:若是希望其传播的正面网络热点消息,且通过预测发现该热点消息在将来的影响范围不会很广,在早期多加强宣传;
若是不希望其传播的恶意谣言网络热点消息,且通过预测发现该热点消息在将来的影响范围会很广泛,在早期及时进行屏蔽、辟谣。
9.根据权利要求1所述的方法,其特征在于,所述SIR模型中包括:传播节点I:对应一类已知相应的热点消息并对其进行了转发的用户;
健康节点S:对应一类尚未得知相应热点消息的用户,与其邻居中是否存在I类用户无关;
免疫节点R:对应一类已知相应的热点消息并对其进行了转发,但其邻居不再转发其热点消息。
10.根据权利要求9所述的方法,其特征在于,对于任一健康节点S,若其邻居节点中至少含有一个传播节点I,则该健康节点S是潜在传播节点PS节点。