欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2020100873234
申请人: 安徽理工大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2023-12-23
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种微博热点话题的用户群体情感倾向迁移动态分析方法,其特征在于,所述的一种微博热点话题的用户群体情感倾向迁移动态分析方法,包括如下步骤:(1)采集指定话题下的微博文本并对文本数据进行预处理,包括过滤停用词、分词操作;

(2)对上诉采集的话题内的微博文本与微博话题的相关性分析,选取与话题相关的文本;

(3)对部分微博文本进行情感极性标注,利用分类特征对标注微博文本集进行训练并优化,生成SVM情感分类器,对未标注微博文本情感极值进行预测;

(4)根据步骤(3)中利用SPSS软件得到先前分析的用户群体情感变化曲线图;根据变化曲线图找到图中异常点;

(5)针对步骤(4)得到的异常点,在其附近按时间对微博文本进行切片分析处理;

(6)如若在步骤(4)中没有发现异常点,则对话题进行热度判断,判断该话题是否已无热度;

(7)动态分析包括以下几步:

1)根据异常点切片处理结果找出引起变化的事件和时间;

2)时间切片的动态分析;

3)时间段的动态获取;

(8)获取新的2小时微博文本后,重复上述步骤;

(9)根据情感趋势折线图,预测未来短时间内情感的可能变化趋势。

2.根据权利要求1所述的一种微博热点话题的用户群体情感倾向迁移动态分析方法,其特征在于:步骤2对微博文本与话题相关性分析主要是利用TF-IDF-SIM法计算微博文本与特定话题的相似程度;对微博文本进行分词之后,统计每个词在微博文本中出现的频率TF和逆文档频率IDF,根据TF-IDF的值来选取靠前的词作为文本关键词,SIM是计算关键词与当前话题词的相似度值。

3.根据权利要求1所述的一种微博热点话题的用户群体情感倾向迁移动态分析方法,其特征在于:步骤(3)对为标注文本进行情感预测方法为:首先进行特征提取,选取包括情感词、否定词、网络用语程度副词和表情符号等作为分类特征,进行训练优化生成SVM分类器;接着利用SVM分类器预测得到微博情感极性。

4.根据权利要求1所述的一种微博热点话题的用户群体情感倾向迁移动态分析方法,所述步骤五的具体过程为:在对文本的情感状态有了总体认识后,将平稳数据进行细化分析,以两小时为单位进行时间切片,利用SPSS软件对情感值进行绘制,从而得到情感值随时间的变化趋势。

5.根据权利要求1所述的一种微博热点话题的用户群体情感倾向迁移动态分析方法,所述步骤六的具体过程为:先根据步骤五的异常点判断,若有异常点,代表微博话题仍有热度,若没有异常点,则对整个话题的热点进行判断;话题没有热度后,则整个分析流程结束;

话题有热度,继续分析。

6.根据权利要求1所述的一种微博热点话题的用户群体情感倾向迁移动态分析方法,其特征在于:根据一天时间内此微博事件的转发量、点赞数、评论数的增加量,和热点事件持续的时间计算热度。

7.根据权利要求1所述的一种微博热点话题的用户群体情感倾向迁移动态分析方法,其特征在于:根据异常点切片处理结果找出引起变化的事件和时间。

8.根据权利要求1所述的一种微博热点话题的用户群体情感倾向迁移动态分析方法其特征在于:异常点切片处理包括以下步骤:首先按时间序列选取异常点前1小时内的文本,对文本按分钟进行排序、处理、分析;以十分钟为一个时间切片,分析是否有微博“大V”、名人博客等能够在很大程度上影响着公众情绪和决策行为的方向角色加入,通过对上述有影响力的人发言和评论、点赞、转发增数较多的微博进行筛选,得到具体影响情感倾向迁移的事件。