1.一种农业病虫害文本命名实体的方法,其特征在于,包括步骤:获取农业病虫害数据集,并将所述农业病虫害数据集进行分析,得到以句子为单位的文本句子;
将所述文本句子输入Bert‑BiLSTM‑CRF模型的LSTM模块中,并分别输出所述文本句子中每个字对应的前向LSTM向量、反向LSTM向量以及字向量;
将获得的前向LSTM向量,字向量和反向LSTM向量进行拼接,并将拼接后的向量作为Bert‑BiLSTM‑CRF模型中CRF模块的输入向量输入所述CRF模块中,并输出预测的序列标签;
将所述CRF模块输出的序列标签转换成逻辑基础描述,并将所述逻辑基础描述与指定知识库中的逻辑规则进行推理匹配;
若匹配不成功,则采用最小化不一致性修正所述CRF模块输出的序列标签;
将修正后的序列标签以及文本句子对CRF模块的参数进行调节;
其中,采用最小化不一致性修正所述CRF模块输出的序列标签的步骤包括:判断所述逻辑基础描述中预测实体的前后是否含有修饰词;
当所述逻辑基础描述中预测实体之前含有修饰词时,将所述序列标签中所述预测实体对应的开始标签向前移动,并对开始标签之后的标签进行复制;
当所述逻辑基础描述中预测实体之后含有修饰词时,将所述序列标签中所述预测实体对应的结束标签向后移动,并对结束标签之前的标签进行复制。
2.如权利要求1所述的农业病虫害文本命名实体的方法,其特征在于,所述将所述文本句子输入Bert‑BiLSTM‑CRF模型的LSTM模块中,并分别输出所述文本句子中每个字对应的前向LSTM向量、反向LSTM向量以及字向量的步骤之前还包括:利用2017CCKS中文电子病历的命名实体识别标注数据集对Bert‑BiLSTM‑CRF模型进行训练;
获取训练结果中的权重文件,并将所述权重文件设置为所述Bert‑BiLSTM‑CRF模型中LSTM模块的初始化权重。
3.如权利要求1所述的农业病虫害文本命名实体的方法,其特征在于,所述将所述CRF模块输出的序列标签转换成逻辑基础描述的步骤包括:将所述CRF模块输出的序列标签和文本句子通过映射函数生成逻辑基础描述。
4.如权利要求1所述的农业病虫害文本命名实体的方法,其特征在于,所述将所述农业病虫害数据集进行分析,得到以句子为单位的文本句子的步骤包括:对所述农业病虫害数据集进行分段、分句处理,去除重复语句操作,得到以句子为单位的文本句子。
5.如权利要求1所述的农业病虫害文本命名实体的方法,其特征在于,所述将所述文本句子输入Bert‑BiLSTM‑CRF模型的LSTM模块中,并分别输出所述文本句子中每个字对应的前向LSTM向量、反向LSTM向量以及字向量的步骤包括:生成所述文本句子的汉字上下文特征向量,并作为Bert‑BiLSTM‑CRF模型中LSTM模块的输入,分别输出所述文本句子中每个字对应的前向LSTM向量、反向LSTM向量以及字向量。
6.一种农业病虫害文本命名实体的装置,其特征在于,包括:分析模块,用于获取农业病虫害数据集,并将所述农业病虫害数据集进行分析,得到以句子为单位的文本句子;
第一输入输出模块,用于将所述文本句子输入Bert‑BiLSTM‑CRF模型的LSTM模块中,并分别输出所述文本句子中每个字对应的前向LSTM向量、反向LSTM向量以及字向量;
拼接模块,用于将获得的前向LSTM向量,字向量和反向LSTM向量进行拼接;
第二输入输出模块,用于将拼接后的向量作为Bert‑BiLSTM‑CRF模型中CRF模块的输入向量输入所述CRF模块中,并输出预测的序列标签;
匹配模块,用于将所述CRF模块输出的序列标签转换成逻辑基础描述,并将所述逻辑基础描述与指定知识库中的逻辑规则进行推理匹配;
修正模块,用于当匹配不成功时,则采用最小化不一致性修正所述CRF模块输出的序列标签;
参数调节模块,用于将修正后的序列标签以及文本句子对CRF模块的参数进行调节;
所述修正模块具体用于:
判断所述逻辑基础描述中预测实体的前后是否含有修饰词;
当所述逻辑基础描述中预测实体之前含有修饰词时,将所述序列标签中所述预测实体对应的开始标签向前移动,并对开始标签之后的标签进行复制;
当所述逻辑基础描述中预测实体之后含有修饰词时,将所述序列标签中所述预测实体对应的结束标签向后移动,并对结束标签之前的标签进行复制。
7.如权利要求6所述的农业病虫害文本命名实体的装置,其特征在于,还包括:训练模块,用于利用2017CCKS中文电子病历的命名实体识别标注数据集对Bert‑BiLSTM‑CRF模型进行训练;
权重设置模块,用于获取训练结果中的权重文件,并将所述权重文件设置为所述Bert‑BiLSTM‑CRF模型中LSTM模块的初始化权重。
8.如权利要求6所述的农业病虫害文本命名实体的装置,其特征在于,所述匹配模块用于:将所述CRF模块输出的序列标签和文本句子通过映射函数生成逻辑基础描述。
9.如权利要求6所述的农业病虫害文本命名实体的装置,其特征在于,所述分析模块用于:对所述农业病虫害数据集进行分段、分句处理,去除重复语句操作,得到以句子为单位的文本句子。