1.一种网络舆情监测分析处理方法,其特征在于,包括以下步骤:
步骤1:将待进行舆情监测的新闻资讯记为目标新闻资讯,进而获取目标新闻资讯在正规新闻发布平台上的发布时间点和发布内容;
步骤2:从目标新闻资讯在正规新闻发布平台上的发布内容中提取发布参数;
步骤3:在发布时间点对应的设定时间间隔后,从目标新闻资讯对应的发布参数中提取发布标题,并将发布标题进行主题关键词提取,进而将提取的主题关键词进行网络搜索,由此得到目标新闻资讯在网络中的若干转传新闻;
步骤4:统计目标新闻资讯在网络中存在的转传新闻数量,并将各条转传新闻按照发布时间点的先后顺序编号为1,2,...,i,...,n;
步骤5:分别采集各条转传新闻对应的发布内容,并从中提取发布参数和发布平台;
步骤6:分别将各条转传新闻的发布参数与目标新闻资讯的发布参数进行对比,由此分析各条转传新闻对应的发布内容真实度;
步骤7:将各条转传新闻对应的发布内容真实度与预设的发布内容真实度阈值进行对比,若某条转传新闻对应的发布内容真实度小于预设的发布内容真实度阈值,则将该条转传新闻记为重点转传新闻;
步骤8:统计目标新闻资讯在网络上存在的重点转传新闻数量,并基于各条重点转传新闻的编号获取各条重点转传新闻对应的发布平台,进而对各条重点转传新闻对应的发布平台进行预警处理。
2.根据权利要求1所述的一种网络舆情监测分析处理方法,其特征在于:所述发布参数包括发布形式、发布标题和发布主体信息。
3.根据权利要求2所述的一种网络舆情监测分析处理方法,其特征在于:所述发布形式包括文本形式、图片形式、视频形式和图文形式。
4.根据权利要求2所述的一种网络舆情监测分析处理方法,其特征在于:所述发布主体信息包括文本信息、图片信息、视频信息和图文信息。
5.根据权利要求3所述的一种网络舆情监测分析处理方法,其特征在于:所述文本形式对应的发布主体信息为文本信息,图片形式对应的发布主体信息为图片信息,视频形式对应的发布主体信息为视频信息,图文形式对应的发布主体信息为图文信息。
6.根据权利要求1所述的一种网络舆情监测分析处理方法,其特征在于:所述步骤6中分析各条转传新闻对应的发布内容真实度具体参照以下:步骤4‑1:从发布内容参数中提取发布标题,并从发布参数中提取发布标题,进而将各条转传新闻对应的发布标题与目标新闻资讯对应的发布标题进行重合对比,从中获取各条转传新闻对应发布标题的重合字数;
步骤4‑2:统计目标新闻资讯对应发布标题的字数,进而将各条转传新闻对应发布标题的重合字数与目标新闻资讯对应发布标题的字数进行对比,计算各条转传新闻对应的发布标题相似度,其计算公式为 TSi表示为第i条转传新闻对应的发布标题相似度,ki表示为第i条转传新闻对应发布标题的重合字数,K表示为目标新闻资讯对应发布标题的总字数;
步骤4‑3:从发布参数中提取发布形式,进而将各条转传新闻对应的发布形式与目标新闻资讯对应的发布形式进行匹配,若某条转传新闻对应的发布形式与目标新闻资讯对应的发布形式匹配一致,则将该条转传新闻对应的发布形式符合度记为ε,并将该条转传新闻记为形似转传新闻,同时执行步骤4‑4,反之则将该条转传新闻对应的发布形式符合度记为ε′,并将该条转传新闻记为形异转传新闻,同时执行步骤4‑5;
步骤4‑4:构建各种发布形式对应的发布主体信息一致度分析算法,进而基于目标新闻资讯对应的发布形式,将形似转传新闻和目标新闻资讯对应的发布主体信息导入相应发布形式对应的发布主体信息一致度分析算法中,分析形似转传新闻对应的发布主体信息一致度,记为λ;
步骤4‑5:分别基于形异转传新闻和目标新闻资讯对应的发布形式识别形异转传新闻和目标新闻资讯对应的实质信息,进而将形异转传新闻对应的实质信息与目标新闻资讯对应的实质信息进行对比,从中获取形异转传新闻对应的实质信息重合字数,进而将形异转传新闻对应的实质信息重合字数与目标新闻资讯对应实质信息的总字数进行对比,分析形异转传新闻对应的发布主体信息一致度,记为λ′,其计算公式为步骤4‑6:将各条转传新闻对应的发布标题相似度、发布形式符合度和发布主体信息一致度通过发布内容真实度计算公式 计算出各条转传新闻对应的发布内容真实度,其中 表示为第i条转传新闻对应的发布内容真实度,FCi表示为第i条转传新闻对应的发布形式符合度,且FCi的取值可以为ε或ε′,SCi表示为第i条转传新闻对应的发布主体信息一致度,且SCi的取值可以为λ或λ′,a、b、c分别表示为发布标题相似度、发布形式符合度、发布主体信息一致度对应的权重系数。
7.根据权利要求6所述的一种网络舆情监测分析处理方法,其特征在于:所述步骤4‑4中各种发布形式对应的发布主体信息一致度分析算法具体为:(1)文本形式对应的主体信息一致度分析算法执行过程如下:
分别将形似转传新闻对应的文本信息与目标新闻资讯对应的文本信息进行去停用词处理,得到形似转传新闻和目标新闻资讯对应的初步处理文本信息;
将形似转传新闻对应的初步处理文本信息与目标新闻资讯对应的初步处理文本信息进行重合对比,由此获取形似转传新闻对应的文本信息重合字数,进而将形似转传新闻对应的文本信息重合字数除以目标新闻资讯对应的初步处理文本信息总字数,得到形似转传新闻对应的发布主体信息一致度;
(2)图片形式对应的主体信息一致度分析算法执行过程如下:
将形似转传新闻对应的图片信息与目标新闻资讯对应的图片信息进行重合,由此获取形似转传新闻对应的图片重合轮廓面积,进而将形似转传新闻对应的图片重合面积除以目标新闻资讯对应的图片轮廓面积,得到形似转传新闻对应的发布主体信息一致度;
(3)视频形式对应的主体信息一致度分析算法执行过程如下:
分别将形似转传新闻对应的视频信息和目标新闻资讯对应的视频信息按照设定的视频侦进行分割,得到若干视频图片;
将形似转传新闻和目标新闻资讯对应视频信息分割的各视频图片按照统一的顺序进行编号;
分别将形似转传新闻和目标新闻资讯中同一编号的视频图片按照图片形式对应的主体信息一致度分析算法进行分析,得到形似转传新闻对应的视频信息中各视频图片对应的发布主体信息一致度;
将形似转传新闻对应的视频信息中各视频图片对应的发布主体信息一致度进行累加,得到形似转传新闻对应的发布主体信息一致度;
(4)图文形式对应的主体信息一致度分析算法执行过程如下:
分别将形似转传新闻和目标新闻资讯对应的图文信息划分为文本部分和图片部分;
依据文本形式对应的主体信息一致度分析算法将形似转传新闻对应图文信息中的文本部分与目标新闻资讯对应图文信息中的文本部分进行对比,得到形似转传新闻对应图文信息中文本部分的发布主体信息一致度;
依据图片形式对应的主体信息一致度分析算法将形似转传新闻对应图文信息中的图片部分与目标新闻资讯对应图文信息中的图片部分进行对比,得到形似转传新闻对应图文信息中图片部分的发布主体信息一致度;
将形似转传新闻对应图文信息中文本部分和图片部分的发布主体信息一致度进行叠加,得到形似转传新闻对应的发布主体信息一致度。
8.根据权利要求6所述的一种网络舆情监测分析处理方法,其特征在于:所述步骤4‑5中分别基于形异转传新闻对应的发布形式和目标新闻资讯对应的发布形式识别形异转传新闻和目标新闻资讯对应的实质信息具体包括:步骤4‑5‑1:搭建各种发布形式对应的实质信息识别模型;
步骤4‑5‑2:分别将形异转传新闻和目标新闻资讯对应的发布主体信息导入相应发布形式对应的实质信息识别模型中,由此识别出形异转传新闻和目标新闻资讯对应的实质信息。
9.一种设备,其特征在于:所述设备包括处理器,以及与处理器连接的内存和网络接口;所述网络接口与服务器中的非易失性存储器连接;所述处理器在运行时通过所述网络接口从所述非易失性存储器中调取计算机程序,并通过所述内存运行所述计算机程序,以执行上述权利要求1‑8任一项所述的方法。
10.一种计算机存储介质,其特征在于:所述计算机存储介质烧录有计算机程序,所述计算机程序在服务器的内存中运行时实现上述权利要求1‑8任一项所述的方法。