欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2022113158747
申请人: 江西农业大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2023-12-04
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种农业病虫害文本命名实体的方法,其特征在于,包括步骤:获取农业病虫害数据集,并将所述农业病虫害数据集进行分析,得到以句子为单位的文本句子;

将所述文本句子输入Bert‑BiLSTM‑CRF模型的LSTM模块中,并分别输出所述文本句子中每个字对应的前向LSTM向量、反向LSTM向量以及字向量;

将获得的前向LSTM向量,字向量和反向LSTM向量进行拼接,并将拼接后的向量作为Bert‑BiLSTM‑CRF模型中CRF模块的输入向量输入所述CRF模块中,并输出预测的序列标签;

将所述CRF模块输出的序列标签转换成逻辑基础描述,并将所述逻辑基础描述与指定知识库中的逻辑规则进行推理匹配;

若匹配不成功,则采用最小化不一致性修正所述CRF模块输出的序列标签;

将修正后的序列标签以及文本句子对CRF模块的参数进行调节;

其中,采用最小化不一致性修正所述CRF模块输出的序列标签的步骤包括:判断所述逻辑基础描述中预测实体的前后是否含有修饰词;

当所述逻辑基础描述中预测实体之前含有修饰词时,将所述序列标签中所述预测实体对应的开始标签向前移动,并对开始标签之后的标签进行复制;

当所述逻辑基础描述中预测实体之后含有修饰词时,将所述序列标签中所述预测实体对应的结束标签向后移动,并对结束标签之前的标签进行复制。

2.如权利要求1所述的农业病虫害文本命名实体的方法,其特征在于,所述将所述文本句子输入Bert‑BiLSTM‑CRF模型的LSTM模块中,并分别输出所述文本句子中每个字对应的前向LSTM向量、反向LSTM向量以及字向量的步骤之前还包括:利用2017CCKS中文电子病历的命名实体识别标注数据集对Bert‑BiLSTM‑CRF模型进行训练;

获取训练结果中的权重文件,并将所述权重文件设置为所述Bert‑BiLSTM‑CRF模型中LSTM模块的初始化权重。

3.如权利要求1所述的农业病虫害文本命名实体的方法,其特征在于,所述将所述CRF模块输出的序列标签转换成逻辑基础描述的步骤包括:将所述CRF模块输出的序列标签和文本句子通过映射函数生成逻辑基础描述。

4.如权利要求1所述的农业病虫害文本命名实体的方法,其特征在于,所述将所述农业病虫害数据集进行分析,得到以句子为单位的文本句子的步骤包括:对所述农业病虫害数据集进行分段、分句处理,去除重复语句操作,得到以句子为单位的文本句子。

5.如权利要求1所述的农业病虫害文本命名实体的方法,其特征在于,所述将所述文本句子输入Bert‑BiLSTM‑CRF模型的LSTM模块中,并分别输出所述文本句子中每个字对应的前向LSTM向量、反向LSTM向量以及字向量的步骤包括:生成所述文本句子的汉字上下文特征向量,并作为Bert‑BiLSTM‑CRF模型中LSTM模块的输入,分别输出所述文本句子中每个字对应的前向LSTM向量、反向LSTM向量以及字向量。

6.一种农业病虫害文本命名实体的装置,其特征在于,包括:分析模块,用于获取农业病虫害数据集,并将所述农业病虫害数据集进行分析,得到以句子为单位的文本句子;

第一输入输出模块,用于将所述文本句子输入Bert‑BiLSTM‑CRF模型的LSTM模块中,并分别输出所述文本句子中每个字对应的前向LSTM向量、反向LSTM向量以及字向量;

拼接模块,用于将获得的前向LSTM向量,字向量和反向LSTM向量进行拼接;

第二输入输出模块,用于将拼接后的向量作为Bert‑BiLSTM‑CRF模型中CRF模块的输入向量输入所述CRF模块中,并输出预测的序列标签;

匹配模块,用于将所述CRF模块输出的序列标签转换成逻辑基础描述,并将所述逻辑基础描述与指定知识库中的逻辑规则进行推理匹配;

修正模块,用于当匹配不成功时,则采用最小化不一致性修正所述CRF模块输出的序列标签;

参数调节模块,用于将修正后的序列标签以及文本句子对CRF模块的参数进行调节;

所述修正模块具体用于:

判断所述逻辑基础描述中预测实体的前后是否含有修饰词;

当所述逻辑基础描述中预测实体之前含有修饰词时,将所述序列标签中所述预测实体对应的开始标签向前移动,并对开始标签之后的标签进行复制;

当所述逻辑基础描述中预测实体之后含有修饰词时,将所述序列标签中所述预测实体对应的结束标签向后移动,并对结束标签之前的标签进行复制。

7.如权利要求6所述的农业病虫害文本命名实体的装置,其特征在于,还包括:训练模块,用于利用2017CCKS中文电子病历的命名实体识别标注数据集对Bert‑BiLSTM‑CRF模型进行训练;

权重设置模块,用于获取训练结果中的权重文件,并将所述权重文件设置为所述Bert‑BiLSTM‑CRF模型中LSTM模块的初始化权重。

8.如权利要求6所述的农业病虫害文本命名实体的装置,其特征在于,所述匹配模块用于:将所述CRF模块输出的序列标签和文本句子通过映射函数生成逻辑基础描述。

9.如权利要求6所述的农业病虫害文本命名实体的装置,其特征在于,所述分析模块用于:对所述农业病虫害数据集进行分段、分句处理,去除重复语句操作,得到以句子为单位的文本句子。