欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2024106152270
申请人: 上海励未信息科技有限公司
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2025-03-07
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种文本数据的情感三元组提取方法,其特征在于,包括以下步骤:

获得样本文本数据,其中,所述样本文本数据包括若干个样本句子;

根据所述样本文本数据以及预设的文本扩展模型,获得所述样本文本数据的若干个类型的扩展文本数据,将若干个类型的扩展文本数据进行组合,获得合成文本数据;

将所述样本文本数据以及合成文本数据输入至预设的特征感知模型中进行编码处理,获得文本编码特征数据;

将所述样本文本数据以及文本编码特征数据输入至初始情感三元组提取模型中,根据所述样本文本数据、文本编码特征数据以及预设的迭代策略,将所述样本文本数据作为首次迭代的初始情感三元组提取模型的情感三元组处理数据进行情感三元组提取,获得当次迭代次数的若干个所述样本句子的预测情感三元组提取结果;根据所述预测情感三元组提取结果,从若干个所述样本句子中确定若干个目标样本句子;

根据若干个所述目标样本句子的编码特征表示以及若干个扩展句子的编码特征表示,采用聚类分析方法,从所述合成文本数据中提取若干个目标扩展句子,作为样本句子加入至所述样本文本数据,构建当次迭代次数的增强文本数据,构建若干次迭代次数的增强文本数据;根据若干次迭代次数的增强文本数据以及相应的迭代次数,对所述初始情感三元组提取模型进行训练,获得目标情感三元组提取模型;

获得待提取文本数据,将所述待提取文本数据输入至目标情感三元组提取模型,获得所述待提取文本数据的情感三元组提取结果。

2.根据权利要求1所述的文本数据的情感三元组提取方法,其特征在于,所述根据所述样本文本数据以及预设的文本扩展模型,获得所述样本文本数据的若干个类型的扩展文本数据,将若干个类型的扩展文本数据进行组合,获得合成文本数据,包括步骤:获得所述文本扩展模型输出的若干个类型的扩展文本数据的标注数据,其中,所述标注数据用于指示所述扩展文本数据中出现标记错误的方面词以及观点词;

根据若干个类型的所述扩展文本数据以及相应的标注数据,对若干个类型的所述扩展文本数据中存在相应的标注数据的方面词或观点词的扩展句子进行删除,获得若干个类型的第一删减文本数据;

根据若干个类型的所述第一删减文本数据,遍历所述样本文本数据,将所述第一删减文本数据中的存在有与所述样本文本数据中的样本句子中相同的方面词的扩展句子进行删除,获得若干个类型的第二删减文本数据,将若干个类型的所述第二删减文本数据进行组合,获得合成文本数据。

3.根据权利要求1所述的文本数据的情感三元组提取方法,其特征在于,所述将所述样本文本数据以及合成文本数据输入至预设的特征感知模型中进行编码处理,获得文本编码特征数据之前,还包括步骤:将训练句子集输入至待训练的特征感知模型中进行编码处理,获得若干个训练句子的编码特征表示;对若干个所述训练句子的编码特征表示进行特征提取,获得若干个训练句子的情感特征表示;对若干个所述训练句子的情感特征表示进行随机失活处理,获得若干个所述训练句子的随机失活特征表示;

获得若干个所述训练句子的情感极性标签数据,根据若干个所述训练句子的情感极性标签数据以及若干个所述训练句子的随机失活特征表示,分别构建若干个训练句子对应的扩展训练句子情感特征表示集以及正例训练句子情感特征表示集;

根据若干个训练句子对应的正例训练句子情感特征表示集、扩展训练句子情感特征表示集以及预设的对比学习损失函数,获得若干个类别的对比学习损失值;根据若干个类别的对比学习损失值,对待训练的特征感知模型进行训练,得到预设的特征感知模型。

4.根据权利要求1所述的文本数据的情感三元组提取方法,其特征在于:所述样本句子包括若干个方面词以及观点词;所述情感三元组提取结果包括情感极性提取结果、方面词提取结果以及观点词提取结果;

所述根据所述预测情感三元组提取结果,从若干个所述样本句子中确定若干个目标样本句子,包括步骤:

获得若干个所述样本句子的真实情感三元组提取结果,根据同一个所述样本句子的真实情感三元组提取结果以及预测情感三元组提取结果进行对比,获得若干个所述样本句子的情感三元组对比结果;

若所述样本句子存在有不相同结果的情感三元组对比结果,将所述样本句子作为目标样本句子,从若干个所述样本句子中确定若干个目标样本句子。

5.根据权利要求1所述的文本数据的情感三元组提取方法,其特征在于,所述根据若干个所述目标样本句子的编码特征表示以及若干个扩展句子的编码特征表示,采用聚类分析方法,从所述合成文本数据中提取若干个目标扩展句子,包括步骤:根据若干个所述目标样本句子的编码特征表示,采用K-means聚类算法,获得聚类特征数据,其中,所述聚类特征数据包括若干个预设的聚类中心点的聚类特征表示;

根据所述聚类特征数据以及若干个扩展句子的编码特征表示,采用欧式距离算法,获得若干个扩展句子的编码特征表示与若干个聚类中心点的聚类特征表示之间的欧式距离;根据所述欧式距离以及预设的句子数目,获得若干个聚类中心点对应的若干个扩展句子;将若干个聚类中心点对应的若干个扩展句子作为目标扩展句子,从所述合成文本数据中提取若干个目标扩展句子。

6.一种文本数据的情感三元组提取装置,其特征在于,包括:

数据获得模块,用于获得样本文本数据,其中,所述样本文本数据包括若干个样本句子;

文本扩展模块,用于根据所述样本文本数据以及预设的文本扩展模型,获得所述样本文本数据的若干个类型的扩展文本数据,将若干个类型的扩展文本数据进行组合,获得合成文本数据;

文本编码模块,用于将所述样本文本数据以及合成文本数据输入至预设的特征感知模型中进行编码处理,获得文本编码特征数据;

模型训练模块,用于将所述样本文本数据以及文本编码特征数据输入至初始情感三元组提取模型中,根据所述样本文本数据、文本编码特征数据以及预设的迭代策略,将所述样本文本数据作为首次迭代的初始情感三元组提取模型的情感三元组处理数据进行情感三元组提取,获得当次迭代次数的若干个所述样本句子的预测情感三元组提取结果;根据所述预测情感三元组提取结果,从若干个所述样本句子中确定若干个目标样本句子;

根据若干个所述目标样本句子的编码特征表示以及若干个扩展句子的编码特征表示,采用聚类分析方法,从所述合成文本数据中提取若干个目标扩展句子,作为样本句子加入至所述样本文本数据,构建当次迭代次数的增强文本数据,构建若干次迭代次数的增强文本数据;根据若干次迭代次数的增强文本数据以及相应的迭代次数,对所述初始情感三元组提取模型进行训练,获得目标情感三元组提取模型;

情感三元组提取模块,用于获得待提取文本数据,将所述待提取文本数据输入至目标情感三元组提取模型,获得所述待提取文本数据的情感三元组提取结果。

7.一种计算机设备,其特征在于,包括处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至5任一项所述的文本数据的情感三元组提取方法的步骤。

8.一种存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述的文本数据的情感三元组提取方法的步骤。