1.基于双向长短时记忆神经网络的文本情感分析方法,其特征在于,所述方法包括以下步骤:S1:将文本映射到词向量映射框架中,将所述文本表示为词向量矩阵;
S2:构建改进的卷积神经网络,对映射的词向量矩阵进行特征提取;
S3:利用双向长短时记忆循环神经网络对提取的特征进行训练,直至其损失函数最小时;
S4:在该双向长短时记忆循环神经网络后增加全局均值池化层和分类层,并替代全连接层,从而输出该文本的情感分类标签;
其中,步骤S4具体包括将每个输出值进行全局均值池化,输出向量经过softmax函数对获得的向量进行转换,计算所有类别预测的概率,根据该概率确定出文本的情感分类标签;
其中,第i个输出节点的全局均值池化表示为 Q表示每个输出节点的维度,yi表示第i个输出节点的输出结果;该节点所预测的概率表示为 d表示输出节点的个数。
2.根据权利要求1所述的基于双向长短时记忆神经网络的文本情感分析方法,其特征在于,所述将文本映射到词向量映射框架中,将所述文本表示为词向量矩阵包括如下:将文本中的每个单词通过查找word2vec模型中的词嵌入矩阵,得到字词的词向量矩阵: 其中,Text表示长度为L的文本;w1:L表示第1个到第L个相邻的词向量;wl表示第l个词的词向量,l∈{1,2,...,L}; 是向量拼接运算符。
3.根据权利要求1所述的基于双向长短时记忆神经网络的文本情感分析方法,其特征在于,所述构建改进的卷积神经网络,对映射的词向量矩阵进行特征提取包括:设置出卷积神经网络中卷积核的宽度和个数;在其输入层中输入词向量矩阵,在其卷积层中将词向量矩阵与不同宽度的卷积核进行卷积,再进行非线性特征映射;使用相同窗口大小的卷积滤波器来提取出多个特征,并将这些特征进行重新排列,形成特征矩阵W;其中,所述改进的卷积神经网络包括输入层和卷积层。
4.根据权利要求3所述的基于双向长短时记忆神经网络的文本情感分析方法,其特征在于,所述进行非线性特征映射包括 其中,f表示非线性激活函数Relu;wq:q+h‑1表示h个相邻的词wq,wq+1,...,wq+h‑1; 表示第m个卷积滤波器提取的第q个特征,m∈(1,2,...,n),n表示卷积滤波器个数;q的取值1,2,...,L‑h+1;h表示进行卷积的长度;L表示文本的长度;b表示偏置值,·表示卷积滤波器和词向量之间进行点乘的操作。
5.根据权利要求4所述的基于双向长短时记忆神经网络的文本情感分析方法,其特征在于,所述使用相同窗口大小的卷积滤波器来提取出多个特征,并将这些特征进行重新排列包括对于窗口大小相同的n个不同权值的卷积滤波器,将提取的n个不同粒度的局部特征进行重新排列,重新排列的特征矩阵表示为表示第n
个卷积滤波器的第L‑h+1个特征。
6.根据权利要求1所述的基于双向长短时记忆神经网络的文本情感分析方法,其特征在于,步骤S3的训练过程包括:获得重新排列后的特征矩阵W,将特征矩阵W送入双向长短时记忆循环神经网络,进行训练;将每个节点的双向输出结果进行拼接,输出值为Y={y1,y2,…,yd},d表示输出点的个数; 和 各自为双向的输出结果,其中,i∈{1,2,...,d},U表示拼接函数。