1.基于情感传播的隐式情感词典生成方法,其特征在于,包括如下步骤:步骤一、通过网络爬虫技术提取出社交媒体中的文本数据,并对非正式文本数据进行处理,恢复成自然语言,恢复后的文本数据记为S={s1,s2,s3,......,sn},其中,sn表示第n个恢复成自然语言的句子;
步骤二、将恢复后的文本数据S={s1,s2,s3,......,sn}构建成为句法树T={t1,t2,t3,......,tn},其中tn表示第n个生成的句法树,将句法树中的名词、动词以及形容词提取出来构建成为完全图G={G1,G2,......,Gn},其中Gn表示第n个由句法树生成的完全图;
步骤三、在完全图中进行情感传播,当情感传播结束后即可获得隐式情感词典;
所述步骤三具体包括:
步骤31、完全图Gn每个节点的词语称为显示情感词语vi,引入大连理工情感词典本体为显示情感词语vi分配初始情感值,其中,预设显示情感词语vi的情感值为 同时,需要对情感值 作归一化处理;
步骤32、预设完全图Gn中每个节点的显示情感词语vi有两个情感值 和 其中, 是词语的正向情感值, 是负向情感值,根据大连理工情感词典本体的情感极性,为显示情感词语vi的两个情感值 和 分配初始情感值;
步骤33、情感传播开始后,计算显示情感词语vi的传播率、受到邻居节点的影响、错别字与词语错误搭配的情况、情感传播以及情感不传播的情况;
步骤34、每次情感传播后计算情感词语vi更新后的情感值;
步骤35、当更新后的情感值计算完成后,通过归一化手段获得显示情感词语vi的最终情感值
步骤36、通过每个词语vi的最终情感值 获得该词语的情感词汇的情感极性,提取出其中的隐式词汇,构建成为隐式情感词典。
2.根据权利要求1所述的基于情感传播的隐式情感词典生成方法,其特征在于,所述步骤一中,对非正式文本数据进行处理,恢复成自然语言具体包括:步骤11、清理掉无用信息,无用信息包括社交媒体为文本数据携带的内容、表情符号、非中文内容;
步骤12、将繁体中文转换成简体中文;
步骤13、对句子进行切割;
步骤14、经步骤11~13处理后的文本数据记为S={s1,s2,s3,......,sn}。
3.根据权利要求1所述的基于情感传播的隐式情感词典生成方法,其特征在于,所述步骤二中具体包括如下步骤:
步骤21、利用Stanford CoreNLP软件将S中的句子进行词法与句法分析,构建句法树,句法树包括包含词语、词性以及词语之间的依赖关系;
步骤22、将句法树中的名词、动词以及形容词提取出来,并通过Stanford CoreNLP软件对每个句子sn进行命名实体识别,清理掉标签为DATE的命名实体,每一个句子sn提取出的词语记为wn={w1,w2,w3,......,wm},其中,wm表示第m个被提取出的词语;
步骤23、采用python处理图数据的库networkx进行完全图的构建,完全图中节点为提取出的词语wn,每两个节点间都有边,边权为该两个词语在语料库中出现的频率,完全图中所有句子构成语料库。
4.根据权利要求1所述的基于情感传播的隐式情感词典生成方法,其特征在于,所述步骤31中,由于大连理工情感词典本体的情感极性是1,3,5,7,9,采用如下公式对显示情感词语vi的情感值 进行归一化处理:
5.根据权利要求4所述的基于情感传播的隐式情感词典生成方法,其特征在于,步骤32中,显示情感词语vi的两个情感值 和 分配初始情感值的分配规则为:完全图Gn中,如果没有词语出现在大连理工情感词典本体中,则完全图Gn中,如果情感值为1,则完全图Gn中,如果情感值为2,则完全图Gn中,如果情感值为3,则
6.根据权利要求5所述的基于情感传播的隐式情感词典生成方法,其特征在于,所述步骤33具体包括如下:
步骤331、显示情感词语vi在初始时刻的传播率为 且不传播率为 而任意时刻,传播率与不传播率之和为1,即
步骤332、计算每个节点在某一时刻受到邻居节点的影响,计算公式为:wij=P(wordi,wordj);
其中, 表示显示情感词语vi在t时刻受到邻居节点的影响,wij表示词语i和词语j在语料库中的共现频率, 表示词语j在某一时刻的传播率,P(wordi,wordj)表示词语i和词语j在语料库中共现的概率,F(wordi,wordj)表示词语i和词语j在语料库中的共现频率,N表示语料库中所有句子的数量,完全图中所有句子构成语料库;
步骤333、计算每个时刻显示情感词语vi的情感传播情况 公式如下:其中,λ用于衡量词语间情感传播的概率,μ用于衡量错别字与词语搭配错误的概率;
计算每个时刻显示情感词语vi的情感不传播情况 公式如下:
7.根据权利要求6所述的基于情感传播的隐式情感词典生成方法,其特征在于,所述步骤34中,情感传播后正向的情感值为 负向的情感值为 其计算公式为:其中, 表示该词语以相同的概率将情感传播给它的邻居节点。
8.根据权利要求7所述的基于情感传播的隐式情感词典生成方法,其特征在于,所述步骤35中,归一化公式为:
9.根据权利要求8所述的基于情感传播的隐式情感词典生成方法,其特征在于,所述步骤36中,获得隐式情感词汇的情感极性的公式为: