1.基于标签描述生成的评论文本情感分类方法,其特征在于,包括以下步骤:S1:为各个情感标签生成对应的具有相关性和区分力的标签描述;
S2:将各个情感标签及其标签描述映射到预先建立的情感分类模型中;
S3:将待分类评论文本输入到所述情感分类模型中,由所述情感分类模型输出对应的预测情感标签;
S4:将待分类评论文本的预测情感标签作为其情感分类的结果。
2.如权利要求1所述的基于标签描述生成的评论文本情感分类方法,其特征在于,步骤S3中,所述情感分类模型通过如下步骤得到预测情感标签:S301:对待分类评论文本进行编码,以得到对应的评论上下文表示;
S302:通过自注意力机制提取评论上下文表示对应的自注意力文本表示;
S303:通过标签注意力机制提取评论上下文表示对应的标签注意力文本表示;
S304:通过自适应门控机制融合所述自注意力文本表示和所述标签注意力文本表示,以生成对应的文本最终表示;
S305:基于所述文本最终表示计算评论上下文表示在情感标签上的分布概率,并将分布概率最高的情感标签作为对应待分类评论文本的预测情感标签。
3.如权利要求2所述的基于标签描述生成的评论文本情感分类方法,其特征在于,步骤S1中,通过如下步骤生成情感标签的标签描述:S101:构建包含若干个评论文本d的语料库D,以及情感标签集C={1,2,…,c};
S102:基于所有情感标签为c的评论文本d计算单词w与情感标签c的相关性得分;
S103:基于所有情感标签为c的评论文本d计算单词w与情感标签c的逆标签频次;
S104:计算单词w相对于情感标签c基于逆标签频次的描述相关性分数;
S105:为情感标签c选取描述相关性分数最高的K个单词[w1,c,…,wi,c,…,wk,c]作为对应的标签描述。
4.如权利要求3所述的基于标签描述生成的评论文本情感分类方法,其特征在于:通过如下公式计算相关性得分:通过如下公式计算逆标签频次:通过如下公式计算描述相关性分数:得到K个单词[w1,c,…,wi,c,…,wk,c]后,使用查找表将作为标签描述的单词wi,c嵌入为de维词向量qi,c,再通过公式 计算得到标签描述qc:c
上述式中:rw,c表示相关性得分;D表示语料库D中所有情感标签为c的评论文本;fw,d表示单词w在评论文本d中出现的次数;fw,D表示语料库D中包含单词w的评论文本数量;ILF表示逆标签频次;LF表示标签频次;yd表示评论文本d对应的情感标签; 表示描述相关性分数;
5.如权利要求4所述的基于标签描述生成的评论文本情感分类方法,其特征在于,步骤S301中,通过如下步骤对待分类评论文本进行编码:将待分类评论文本转换成评论文本序列d={w1,…,wi,…,wn};
使用词向量矩阵 把评论文本序列中的单词wi嵌入为一个词向量将词向量xi输入到第一双向GRU中计算词向量xi的浅层隐藏表示;
将词向量xi的浅层隐藏表示输入到第二双向GRU中计算单词之间更复杂的交互作用,以得到词向量xi的交互作用表示;
使用残差连接融合词向量xi的浅层隐藏表示和交互作用表示得到词向量xi的文本表示;
计算各个词向量xi的文本表示以得到待分类评论文本的评论上下文表示;
其中,第一双向GRU分别通过对应的正向GRU和反向GRU计算 和 进而计算词向量xi的浅层隐藏表示
表示从x1到xn读取词向量序列;
表示从xn到x1读取词向量序列;
第二双向GRU分别通过对应的正向GRU和反向GRU计算 和 进而计算词向量xi的文本表示
表示从x1到xn读取词向量序列;
表示从xn到x1读取词向量序列;
词向量xi的文本表示如下:待分类评论文本的评论上下文表示如下:上述式中:γ∈[0,1]表示超参数;
6.如权利要求5所述的基于标签描述生成的评论文本情感分类方法,其特征在于,步骤S2中,具体包括如下步骤:基于各个情感标签及其标签描述qc生成对应的标签表示矩阵QL;
将标签表示矩阵QL映射到与评论上下文表示 相同的空间向量 并将空间向量 融合到注意力机制中得到对应的标签注意力机制;
QL=(q1,q2,…,qC);
上述式中: 是可训练的模型参数。
7.如权利要求6所述的基于标签描述生成的评论文本情感分类方法,其特征在于,步骤S302中,通过如下步骤提取自注意力文本表示:(s)
通过公式 计算评论上下文表示的注意力分数A ;
表示评论上下文表示中所有单词对第j个情感标签的贡献;
通过公式 计算评论上下文表示沿第j个情感标签的新表示(s)
计算评论上下文表示沿其他情感标签的新表示得到对应的自注意力文本表示H ;
上述式中: 和 是可训练的自注意力参数;
8.如权利要求7所述的基于标签描述生成的评论文本情感分类方法,其特征在于,步骤S303中,通过如下步骤提取标签注意力文本表示:(l)
通过公式 计算单词与情感标签之间的语义关系A ;
通过公式 计算评论上下文表示中所有单词与情感标签之间的语义关系,进(l)
而得到对应的标签注意力文本表示H ;
上述式中:
9.如权利要求8所述的基于标签描述生成的评论文本情感分类方法,其特征在于,步骤S304中,通过如下步骤生成文本最终表示:(s) (l)
通过权重向量a和μ决定自注意力文本表示H 和标签注意力文本表示H 的重要性;
(s)
a=sigmoid(H W4);
(l)
μ=sigmoid(H W5);
通过aj和μj分别表示沿第j个情感标签构造文本最终表示时自注意力和标签注意力的重要性;
对aj和μj进行正则化得到μj=1‑aj;
结合公式 计算评论上下文表示沿第j个情感标签的最终表示H′j;
计算评论上下文表示沿其他情感标签的最终表示得到对应的文本最终表示H′;
使用均值池化 计算得到评论上下文表示的文本最终表示上述式中: 均是可训练的模型参数;
10.如权利要求9所述的基于标签描述生成的评论文本情感分类方法,其特征在于,步骤S305中,通过如下步骤生成预测情感标签:使用一个两层前馈神经网络作为情感分类器;
将评论上下文表示的文本最终表示输入所述情感分类器中,由所述情感分类器基于公式 计算评论上下文表示在情感标签上的分布概率;
将分布概率最高的情感标签作为对应待分类评论文本的预测情感标签;
上述式中: 均是可训练的模型参数。