1.一种医疗命名实体识别方法,其特征在于:包括以下过程:获取待识别的医疗文本数据;
根据获取的医疗文本数据,得到至少一个句子中的词嵌入向量;
进行句子中短语的语法角色标记,结合短语之间的依存关系,得到短语之间的关系图,根据预设图卷积神经网络中,得到特征向量;
将获取的词嵌入向量和特征向量进行拼接,得到拼接后的输入向量;
根据拼接后的输入向量和预设动态堆叠网络,得到医疗命名实体识别结果;
其中,所述动态堆叠网络中,根据句子的嵌套层数确定Transformer‑CRF层的叠加数量;
将短语定义为结点,将短语之间的依存关系定义为边,利用图卷积神经网络通过所述关系图上操作聚集结点的邻域特征;
如果只有一层卷积,则捕获直接邻居节点特征,如果具有多层卷积堆叠卷积层,则捕获最多K跳跃的任何结点特征。
2.如权利要求1所述的医疗命名实体识别方法,其特征在于:如果当前Transformer‑CRF层预测到实体,则引入一个新的Transformer‑CRF层,结合当前Transformer‑CRF层检测到的每个实体的单词序列表示,组成该实体的新表示,然后将其作为输入传递到新的Transformer‑CRF层。
3.如权利要求1所述的医疗命名实体识别方法,其特征在于:动态堆叠网络中,如果当前Transformer‑CRF层检预测到非实体,则保留字符表示而不进行任何处理。
4.如权利要求1所述的医疗命名实体识别方法,其特征在于:短语之间的依存关系分析时没有非终结符,词与词相互依存,两个词分别为核心词和从属词,用有向弧表示,弧的方向为核心词指向从属词,弧上的标记为依存关系类型。
5.如权利要求1所述的医疗命名实体识别方法,其特征在于:利用XLnet语言模型进行词向量的获取,且XLnet语言模型采用双流注意力机制。
6.一种医疗命名实体识别系统,其特征在于:包括:数据获取模块,被配置为:获取待识别的医疗文本数据;
词嵌入向量获取模块,被配置为:根据获取的医疗文本数据,得到至少一个句子中的词嵌入向量;
特征向量提取模块,被配置为:进行句子中短语的语法角色标记,结合短语之间的依存关系,得到短语之间的关系图,根据预设图卷积神经网络中,得到特征向量;
向量拼接模块,被配置为:将获取的词嵌入向量和特征向量进行拼接,得到拼接后的输入向量;
实体识别模块,被配置为:根据拼接后的输入向量和预设动态堆叠网络,得到医疗命名实体识别结果;
其中,所述动态堆叠网络中,根据句子的嵌套层数确定Transformer‑CRF层的叠加数量;
将短语定义为结点,将短语之间的依存关系定义为边,利用图卷积神经网络通过所述关系图上操作聚集结点的邻域特征;
如果只有一层卷积,则捕获直接邻居节点特征,如果具有多层卷积堆叠卷积层,则捕获最多K跳跃的任何结点特征。
7.一种计算机可读存储介质,其上存储有程序,其特征在于,该程序被处理器执行时实现如权利要求1‑5任一项所述的医疗命名实体识别方法中的步骤。
8.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,其特征在于,所述处理器执行所述程序时实现如权利要求1‑5任一项所述的医疗命名实体识别方法中的步骤。