1.一种基于堆叠双向lstm神经网络的文本相似度计算方法,其特征在于:包括以下步骤:步骤一,将输入词向量以网络堆叠的方式输入到lstm神经网络中,得到输入句子向量;
步骤二,按照前面步骤得到两个输入句子的句子向量;将两个输入句子的句子向量输入到分类器中,得到这两个句子的相似度;
在步骤一之前,将带有相似度标签的语料文本分词,得到的词向量作为目标词向量;将目标词向量以网络堆叠的方式输入到lstm神经网络中,得到目标句子向量;将与输入句子向量具有相同语义的目标句子向量作为正样本,将除此之外的其他目标句子向量作为负样本;通过正样本、负样本和输入句子向量训练lstm神经网络模型和分类器,分别得到lstm神经网络参数和分类器的全连接层参数;
所述分类器包括依次连接的输入层、批处理层、拼接层、全连接层以及概率层;
所述输入层,用来输入包括输入句子向量特征、正样本和负样本在内的句子向量特征;
所述批处理层,用来对输入的句子向量特征进行批量归一化处理;
所述拼接层,用来将归一化处理后的句子向量拼接成为行向量;
所述全连接层,用来将行向量按照正样本和负样本进行二维对比;
所述概率层,用来得到行向量分别与正样本和负样本的相似概率。
2.根据权利要求1所述的基于堆叠双向lstm神经网络的文本相似度计算方法,其特征在于:在步骤一之前,将输入句子分词并计算词向量,得到的词向量作为输入词向量。
3.根据权利要求1所述的基于堆叠双向lstm神经网络的文本相似度计算方法,其特征在于:所述相似度分别针对正样本或者负样本,所述相似度包括针对同一样本相似和不相似的二维概率。
4.根据权利要求2所述的基于堆叠双向lstm神经网络的文本相似度计算方法,其特征在于:在分词后得到词向量时,采用word2vec进行词向量计算。
5.根据权利要求1所述的基于堆叠双向lstm神经网络的文本相似度计算方法,其特征在于:所述拼接层拼接形成的行向量为:[u,v,abs(u‑v),element‑wise product(u⊙v), cos similarity(u,v)];
其中,u为句子1的输入句子向量特征,v为句子2的输入句子向量特征;
abs(u‑v)代表u‑v向量的绝对值;
element‑wise product(u⊙v)代表u,v向量的元素积;
cos similarity(u,v)代表u,v向量的cos相似度。
6.根据权利要求1所述的基于堆叠双向lstm神经网络的文本相似度计算方法,其特征在于:建立目标优化函数,优化lstm神经网络参数和分类器的全连接层参数;所述目标优化函数为交叉熵或者Adam 迭代优化方法。