1.一种基于加窗词向量特征的短文本情感分析方法,其特征在于,包括步骤:S1、词向量训练:对大规模语料进行预处理,再对预处理后的大语料进行词向量训练,得到一定维度的词向量;
S2、特征提取:对待分析文本进行预处理,选择文本情感分类中的若干特征,对特征进行筛选,选出最具有区分能力的特征;
S3、词向量转换:将步骤S2得到的数据转换为由步骤S1中的词向量所组成的文本向量;
S4、加窗操作:对文本向量中的词向量进行加窗操作,形成新的组合维度;
S5、独立分类器建模:对步骤S4中加窗后的词向量进行建模训练,得出各自的识别率;
S6、分类器加权融合:使用网格搜索方法寻找最优的权重组合,将权重与对应的分类器判定概率相乘求和,得到最终分析结果。
2.根据权利要求1所述的一种基于加窗词向量特征的短文本情感分析方法,其特征在于,所述步骤S1具体包括:词向量训练:对大规模语料进行预处理,采用Word2Vec工具对预处理后的大语料进行词向量训练得到一定维度的词向量。
3.根据权利要求1所述的一种基于加窗词向量特征的短文本情感分析方法,其特征在于,所述步骤S2具体包括:特征提取:对待分析文本进行预处理,先选择文本情感分类中的一元词特征、句法特征和基于词典的特征,再对特征进行筛选,选出最具有区分能力的特征。
4.根据权利要求1或3所述的一种基于加窗词向量特征的短文本情感分析方法,其特征在于,所述步骤S2中的对特征进行筛选所采用的方法为IG、MI方法。
5.根据权利要求1所述的一种基于加窗词向量特征的短文本情感分析方法,其特征在于,所述步骤S4具体包括:加窗操作:对文本向量中的词向量进行加窗操作,形成新的组合维度,其中窗长从2到
7。