欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2018111561633
申请人: 江苏师范大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-01-05
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于加窗词向量特征的短文本情感分析方法,其特征在于,包括步骤:S1、词向量训练:对大规模语料进行预处理,再对预处理后的大语料进行词向量训练,得到一定维度的词向量;

S2、特征提取:对待分析文本进行预处理,选择文本情感分类中的若干特征,对特征进行筛选,选出最具有区分能力的特征;

S3、词向量转换:将步骤S2得到的数据转换为由步骤S1中的词向量所组成的文本向量;

S4、加窗操作:对文本向量中的词向量进行加窗操作,形成新的组合维度;

S5、独立分类器建模:对步骤S4中加窗后的词向量进行建模训练,得出各自的识别率;

S6、分类器加权融合:使用网格搜索方法寻找最优的权重组合,将权重与对应的分类器判定概率相乘求和,得到最终分析结果。

2.根据权利要求1所述的一种基于加窗词向量特征的短文本情感分析方法,其特征在于,所述步骤S1具体包括:词向量训练:对大规模语料进行预处理,采用Word2Vec工具对预处理后的大语料进行词向量训练得到一定维度的词向量。

3.根据权利要求1所述的一种基于加窗词向量特征的短文本情感分析方法,其特征在于,所述步骤S2具体包括:特征提取:对待分析文本进行预处理,先选择文本情感分类中的一元词特征、句法特征和基于词典的特征,再对特征进行筛选,选出最具有区分能力的特征。

4.根据权利要求1或3所述的一种基于加窗词向量特征的短文本情感分析方法,其特征在于,所述步骤S2中的对特征进行筛选所采用的方法为IG、MI方法。

5.根据权利要求1所述的一种基于加窗词向量特征的短文本情感分析方法,其特征在于,所述步骤S4具体包括:加窗操作:对文本向量中的词向量进行加窗操作,形成新的组合维度,其中窗长从2到

7。