欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2018110755716
申请人: 重庆邂智科技有限公司
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-08-26
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于堆叠双向lstm神经网络的文本相似度计算方法,其特征在于:包括以下步骤:步骤一,将输入词向量以网络堆叠的方式输入到lstm神经网络中,得到输入句子向量;

步骤二,按照前面步骤得到两个输入句子的句子向量;将两个输入句子的句子向量输入到分类器中,得到这两个句子的相似度;

在步骤一之前,将带有相似度标签的语料文本分词,得到的词向量作为目标词向量;将目标词向量以网络堆叠的方式输入到lstm神经网络中,得到目标句子向量;将与输入句子向量具有相同语义的目标句子向量作为正样本,将除此之外的其他目标句子向量作为负样本;通过正样本、负样本和输入句子向量训练lstm神经网络模型和分类器,分别得到lstm神经网络参数和分类器的全连接层参数;

所述分类器包括依次连接的输入层、批处理层、拼接层、全连接层以及概率层;

所述输入层,用来输入包括输入句子向量特征、正样本和负样本在内的句子向量特征;

所述批处理层,用来对输入的句子向量特征进行批量归一化处理;

所述拼接层,用来将归一化处理后的句子向量拼接成为行向量;

所述全连接层,用来将行向量按照正样本和负样本进行二维对比;

所述概率层,用来得到行向量分别与正样本和负样本的相似概率。

2.根据权利要求1所述的基于堆叠双向lstm神经网络的文本相似度计算方法,其特征在于:在步骤一之前,将输入句子分词并计算词向量,得到的词向量作为输入词向量。

3.根据权利要求1所述的基于堆叠双向lstm神经网络的文本相似度计算方法,其特征在于:所述相似度分别针对正样本或者负样本,所述相似度包括针对同一样本相似和不相似的二维概率。

4.根据权利要求2所述的基于堆叠双向lstm神经网络的文本相似度计算方法,其特征在于:在分词后得到词向量时,采用word2vec进行词向量计算。

5.根据权利要求1所述的基于堆叠双向lstm神经网络的文本相似度计算方法,其特征在于:所述拼接层拼接形成的行向量为:[u,v,abs(u‑v),element‑wise product(u⊙v), cos similarity(u,v)];

其中,u为句子1的输入句子向量特征,v为句子2的输入句子向量特征;

abs(u‑v)代表u‑v向量的绝对值;

element‑wise product(u⊙v)代表u,v向量的元素积;

cos similarity(u,v)代表u,v向量的cos相似度。

6.根据权利要求1所述的基于堆叠双向lstm神经网络的文本相似度计算方法,其特征在于:建立目标优化函数,优化lstm神经网络参数和分类器的全连接层参数;所述目标优化函数为交叉熵或者Adam 迭代优化方法。