欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2021105427893
申请人: 西华大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-02-23
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.基于情感传播的隐式情感词典生成方法,其特征在于,包括如下步骤:步骤一、通过网络爬虫技术提取出社交媒体中的文本数据,并对非正式文本数据进行处理,恢复成自然语言,恢复后的文本数据记为S={s1,s2,s3,......,sn},其中,sn表示第n个恢复成自然语言的句子;

步骤二、将恢复后的文本数据S={s1,s2,s3,......,sn}构建成为句法树T={t1,t2,t3,......,tn},其中tn表示第n个生成的句法树,将句法树中的名词、动词以及形容词提取出来构建成为完全图G={G1,G2,......,Gn},其中Gn表示第n个由句法树生成的完全图;

步骤三、在完全图中进行情感传播,当情感传播结束后即可获得隐式情感词典;

所述步骤三具体包括:

步骤31、完全图Gn每个节点的词语称为显示情感词语vi,引入大连理工情感词典本体为显示情感词语vi分配初始情感值,其中,预设显示情感词语vi的情感值为 同时,需要对情感值 作归一化处理;

步骤32、预设完全图Gn中每个节点的显示情感词语vi有两个情感值 和 其中, 是词语的正向情感值, 是负向情感值,根据大连理工情感词典本体的情感极性,为显示情感词语vi的两个情感值 和 分配初始情感值;

步骤33、情感传播开始后,计算显示情感词语vi的传播率、受到邻居节点的影响、错别字与词语错误搭配的情况、情感传播以及情感不传播的情况;

步骤34、每次情感传播后计算情感词语vi更新后的情感值;

步骤35、当更新后的情感值计算完成后,通过归一化手段获得显示情感词语vi的最终情感值

步骤36、通过每个词语vi的最终情感值 获得该词语的情感词汇的情感极性,提取出其中的隐式词汇,构建成为隐式情感词典。

2.根据权利要求1所述的基于情感传播的隐式情感词典生成方法,其特征在于,所述步骤一中,对非正式文本数据进行处理,恢复成自然语言具体包括:步骤11、清理掉无用信息,无用信息包括社交媒体为文本数据携带的内容、表情符号、非中文内容;

步骤12、将繁体中文转换成简体中文;

步骤13、对句子进行切割;

步骤14、经步骤11~13处理后的文本数据记为S={s1,s2,s3,......,sn}。

3.根据权利要求1所述的基于情感传播的隐式情感词典生成方法,其特征在于,所述步骤二中具体包括如下步骤:

步骤21、利用Stanford CoreNLP软件将S中的句子进行词法与句法分析,构建句法树,句法树包括包含词语、词性以及词语之间的依赖关系;

步骤22、将句法树中的名词、动词以及形容词提取出来,并通过Stanford CoreNLP软件对每个句子sn进行命名实体识别,清理掉标签为DATE的命名实体,每一个句子sn提取出的词语记为wn={w1,w2,w3,......,wm},其中,wm表示第m个被提取出的词语;

步骤23、采用python处理图数据的库networkx进行完全图的构建,完全图中节点为提取出的词语wn,每两个节点间都有边,边权为该两个词语在语料库中出现的频率,完全图中所有句子构成语料库。

4.根据权利要求1所述的基于情感传播的隐式情感词典生成方法,其特征在于,所述步骤31中,由于大连理工情感词典本体的情感极性是1,3,5,7,9,采用如下公式对显示情感词语vi的情感值 进行归一化处理:

5.根据权利要求4所述的基于情感传播的隐式情感词典生成方法,其特征在于,步骤32中,显示情感词语vi的两个情感值 和 分配初始情感值的分配规则为:完全图Gn中,如果没有词语出现在大连理工情感词典本体中,则完全图Gn中,如果情感值为1,则完全图Gn中,如果情感值为2,则完全图Gn中,如果情感值为3,则

6.根据权利要求5所述的基于情感传播的隐式情感词典生成方法,其特征在于,所述步骤33具体包括如下:

步骤331、显示情感词语vi在初始时刻的传播率为 且不传播率为 而任意时刻,传播率与不传播率之和为1,即

步骤332、计算每个节点在某一时刻受到邻居节点的影响,计算公式为:wij=P(wordi,wordj);

其中, 表示显示情感词语vi在t时刻受到邻居节点的影响,wij表示词语i和词语j在语料库中的共现频率, 表示词语j在某一时刻的传播率,P(wordi,wordj)表示词语i和词语j在语料库中共现的概率,F(wordi,wordj)表示词语i和词语j在语料库中的共现频率,N表示语料库中所有句子的数量,完全图中所有句子构成语料库;

步骤333、计算每个时刻显示情感词语vi的情感传播情况 公式如下:其中,λ用于衡量词语间情感传播的概率,μ用于衡量错别字与词语搭配错误的概率;

计算每个时刻显示情感词语vi的情感不传播情况 公式如下:

7.根据权利要求6所述的基于情感传播的隐式情感词典生成方法,其特征在于,所述步骤34中,情感传播后正向的情感值为 负向的情感值为 其计算公式为:其中, 表示该词语以相同的概率将情感传播给它的邻居节点。

8.根据权利要求7所述的基于情感传播的隐式情感词典生成方法,其特征在于,所述步骤35中,归一化公式为:

9.根据权利要求8所述的基于情感传播的隐式情感词典生成方法,其特征在于,所述步骤36中,获得隐式情感词汇的情感极性的公式为: